Meu post inaugural @delphi_intel é sobre Modelos de vídeo Gen AI. Resumo abaixo (1/10) 👇 s/o para @moonshot6666 por seu feedback sobre este ensaio e @PJaccetturo por este vídeo de hype incrível que vou roubar descaradamente. TLDR: os vídeos estão 2-3 anos atrás do texto. Eles estão ficando muito bons, muito rápido
1. Os humanos são criaturas visuais. A modalidade de conteúdo da Gen AI provavelmente tenderá a uma distribuição semelhante à web:
2. O mercado é grande: >US$ 40 bilhões + bilhões até 2030 (com adjacências relevantes). A disrupção no marketing, entretenimento e educação é óbvia, mas também implicações claras na robótica, vigilância e tarefas agenciais de longo prazo
3. A paisagem tem muita competição entre pilhas Inclui empresas de modelos, aplicativos multimodais, avatares falantes, sincronização labial e muito mais. Sem mencionar toda a infraestrutura necessária para alimentar verdadeiros modelos e aplicativos multimodais. s/o para @venturetwins e @a16z para o mapa
4. Leste vs. Oeste. A corrida é amplamente dividida entre os EUA e a China. Em modelos de vídeo, a China lidera (9 dos 15 principais modelos) s/o @ArtificialAnlys
6. Big Tech Advantage: canalizar esses novos recursos para ecossistemas de usuários de > 1 bilhão será um alto ROI Com base nos atributos abaixo, não é chocante que grandes players como $Goog, $meta, $techy, $baba e Bytedance estejam bem posicionados.
7. Acumulação de valor: Ao mesmo tempo, vemos bolsões em toda a pilha - principalmente em infraestrutura e aplicativos - onde novos participantes podem criar grandes negócios (Sim, você precisará ler o relatório real para qualquer alfa, preguiçoso)
8. Verdadeira multimodalidade Hoje, os modelos de vídeo parecem um brinquedo. Mas os dados de vídeo e as simulações são uma entrada cada vez mais essencial para tarefas agenciais de formato longo e para iniciar a revolução da robótica. Os modelos de vídeo podem ser a faísca.
3,29K