Postarea mea inaugurală @delphi_intel este despre modelele video Gen AI. Rezumatul de mai jos (1/10) 👇 s/o să @moonshot6666 pentru feedback-ul său despre acest eseu și @PJaccetturo pentru acest videoclip de hype pe care îl voi fura fără rușine. TLDR: videoclipurile sunt cu 2-3 ani în urmă cu textul. Ei devin foarte buni, foarte repede
1. Oamenii sunt creaturi vizuale. Modalitatea de conținut Gen AI va tinde probabil spre o distribuție similară cu web-ul:
2. Piața este mare: >40 miliarde de dolari+ până în 2030 (cu adiacențe relevante). Perturbarea în marketing, divertisment și educație este evidentă, dar și implicații clare în robotică, supraveghere și sarcini agentice pe termen lung
3. Peisajul are o mulțime de concurență între stive Include companii model, aplicații multimodale, avatare vorbitoare, sincronizare de buze și multe altele. Ca să nu mai vorbim de toată infrastructura necesară pentru a alimenta modele și aplicații multimodale adevărate. s/o la @venturetwins și @a16z pentru hartă
4. Est vs. Vest. Cursa este în mare parte împărțită între SUA și China. În ceea ce privește modelele video, China este lider (9 din primele 15 modele) s/o @ArtificialAnlys
6. Avantajul Big Tech: direcționarea acestor noi capabilități către ecosistemele de utilizatori >1b va avea un ROI ridicat Pe baza atributelor de mai jos, nu este șocant faptul că jucători mari precum $Goog, $meta, $techy, $baba și Bytedance sunt bine poziționați.
7. Acumularea valorii: În același timp, vedem buzunare în întreaga stivă - în special în infrastructură și aplicații - unde noii intrați pot crea afaceri mari (Da, va trebui să citiți raportul real pentru orice alfa, fundul leneș)
8. Adevărata multimodalitate Astăzi, modelele video arată ca o jucărie. Dar datele video și simulările sunt o intrare din ce în ce mai esențială pentru sarcinile agentice de lungă durată și în demararea revoluției roboticii. Modelele video ar putea dovedi scânteia.
1,26K