O meu post inaugural @delphi_intel é sobre Modelos de Vídeo de IA Gen. Resumo abaixo (1/10)👇 agradecimentos a @moonshot6666 pelo seu feedback sobre este ensaio e a @PJaccetturo pelo este vídeo hype incrível que vou roubar sem vergonha. TLDR: os vídeos estão 2-3 anos atrasados em relação ao texto. Estão a melhorar muito, muito rápido.
1. Os humanos são criaturas visuais. A modalidade de conteúdo da Gen AI provavelmente tenderá a uma distribuição semelhante à da web:
2. O mercado é grande: >US$40b+ bilhões até 2030 (com adjacências relevantes). A disrupção no marketing, entretenimento e educação é óbvia, mas também há implicações claras em robótica, vigilância e tarefas agentivas de longo prazo.
3. O panorama tem muita competição entre pilhas cruzadas Inclui empresas modelo, aplicações multimodais, avatares falantes, sincronização labial e muito mais. Sem mencionar toda a infraestrutura necessária para alimentar verdadeiros modelos e aplicações multimodais. s/o para @venturetwins e @a16z pelo mapa
4. Leste vs. Oeste. A corrida está amplamente dividida entre os EUA e a China. Nos modelos de vídeo, a China está liderando (9 dos 15 melhores modelos) s/o @ArtificialAnlys
6. Vantagem das Grandes Tecnologias: canalizar essas novas capacidades para ecossistemas de >1b utilizadores terá um alto retorno sobre o investimento Com base nos atributos abaixo, não é surpreendente que grandes players como $Goog, $meta, $techy, $baba e Bytedance estejam bem posicionados.
7. Acumulação de valor: Ao mesmo tempo, vemos áreas em toda a pilha - particularmente em infra e apps - onde novos entrantes podem criar grandes negócios (Sim, você precisará ler o relatório real para qualquer alpha, preguiçoso)
8. Verdadeira multimodalidade Hoje, os modelos de vídeo parecem um brinquedo. Mas os dados de vídeo e as simulações são uma entrada cada vez mais essencial para tarefas longas e agentivas e para dar início à revolução da robótica. Os modelos de vídeo podem ser a faísca.
1,25K