Il mio post inaugurale su @delphi_intel riguarda i modelli video di Gen AI. Riepilogo qui sotto (1/10)👇 Grazie a @moonshot6666 per il suo feedback su questo saggio e a @PJaccetturo per questo fantastico video promozionale che ruberò senza vergogna. TLDR: i video sono indietro di 2-3 anni rispetto ai testi. Stanno diventando molto bravi, molto in fretta.
1. Gli esseri umani sono creature visive. La modalità di contenuto dell'IA generativa tenderà probabilmente verso una distribuzione simile a quella del web:
2. Il mercato è grande: >40 miliardi di dollari entro il 2030 (con le relative adiacenze). La disruption nel marketing, nell'intrattenimento e nell'istruzione è ovvia, ma ci sono anche chiare implicazioni nella robotica, nella sorveglianza e nei compiti agentici a lungo termine.
3. Il panorama ha molta competizione cross-stack Include aziende modello, app multimodali, avatar parlanti, sincronizzazione labiale e altro ancora. Per non parlare di tutta l'infrastruttura necessaria per alimentare veri modelli e app multimodali. s/o a @venturetwins e @a16z per la mappa
4. Est vs. Ovest. La corsa è per lo più divisa tra gli Stati Uniti e la Cina. Nei modelli video, la Cina è in testa (9 dei primi 15 modelli) s/o @ArtificialAnlys
6. Vantaggio delle Grandi Aziende Tecnologiche: fornire queste nuove capacità a ecosistemi con oltre 1 miliardo di utenti avrà un alto ROI Basandosi sulle seguenti caratteristiche, non sorprende che grandi attori come $Goog, $meta, $techy, $baba e Bytedance siano ben posizionati.
7. Accumulo di valore: Allo stesso tempo, vediamo aree in tutto lo stack - in particolare nell'infrastruttura e nelle app - dove i nuovi entranti possono ritagliarsi grandi business (Sì, dovrai leggere il rapporto reale per qualsiasi alpha, pigrone)
8. Vera multimodalità Oggi, i modelli video sembrano un giocattolo. Ma i dati video e le simulazioni sono un input sempre più essenziale per compiti agentici a lungo termine e per avviare la rivoluzione della robotica. I modelli video potrebbero rivelarsi la scintilla.
3,26K