我在 @delphi_intel 的首篇文章是關於生成 AI 影片模型。以下是摘要 (1/10)👇 感謝 @moonshot6666 對這篇文章的反饋,以及 @PJaccetturo 提供的這段超棒的宣傳影片,我會毫不客氣地偷用。 簡而言之:影片的發展落後於文字 2-3 年。它們正在變得非常好,速度也非常快。
1. 人類是視覺生物。 生成式 AI 內容的模式可能會趨向於類似於網路的分佈:
2. 市場龐大:到2030年將超過400億美元(包括相關的鄰近領域)。 在行銷、娛樂和教育方面的顛覆是顯而易見的,但在機器人技術、監控和長期代理任務方面也有明確的影響。
3. 這個領域有很多跨堆疊的競爭 包括模型公司、多模態應用、對話虛擬角色、口型同步等等。更不用說所有支持真正多模態模型和應用所需的基礎設施。 感謝 @venturetwins 和 @a16z 提供的地圖
4. 東方 vs. 西方。 這場競賽主要在美國和中國之間分裂。在視頻模型中,中國領先(前15名模型中有9個) s/o @ArtificialAnlys
6. 大型科技優勢:將這些新能力輸送到超過10億用戶生態系統將帶來高投資回報率 根據以下屬性,像$Goog、$meta、$techy、$baba和字節跳動這樣的大型玩家處於有利位置並不令人驚訝。
7. 價值累積: 同時,我們看到整個堆疊中有一些機會——特別是在基礎設施和應用程式方面——新進者可以開創大型業務。 (是的,你需要閱讀實際報告以獲取任何資訊,懶惰的傢伙)
8. 真正的多模態 今天,視頻模型看起來像是一個玩具。但視頻數據和模擬正日益成為長期代理任務和啟動機器人革命的重要輸入。 視頻模型可能正好成為火花。
1.25K