Моя інавгураційна @delphi_intel пост присвячена відеомоделям покоління AI. Підсумок нижче (1/10) 👇 s/o to @moonshot6666 за його відгук на цей есе & @PJaccetturo за це дурманне хайпове відео я безсоромно вкраду. TLDR: відео відстають від тексту на 2-3 роки. Вони стають дуже хорошими, дуже швидкими
1. Людина – істота візуальна. Модальність контенту покоління AI, ймовірно, матиме тенденцію до розподілу, подібного до вебу:
2. Ринок великий: >40 млрд доларів США+ млрд до 2030 року (з відповідними суміжностями). Прорив у маркетингу, розвагах та освіті очевидний, але також очевидні наслідки в робототехніці, спостереженні та довгострокових агентських завданнях
3. Landscape має велику конкуренцію між стеками Включає модельні компанії, мультимодальні додатки, аватари, що говорять, синхронізацію губ і багато іншого. Не кажучи вже про всю інфраструктуру, необхідну для живлення справжніх мультимодальних моделей і додатків. з/о до @venturetwins та @a16z до карти
4. Схід проти Заходу. Перегони значною мірою розділені між США та Китаєм. У відеомоделях лідирує Китай (9 з 15 кращих моделей) С/О @ArtificialAnlys
6. Перевага Big Tech: перенесення цих нових можливостей на екосистеми користувачів >1b забезпечить високу рентабельність інвестицій Виходячи з наведених нижче атрибутів, не дивно, що такі великі гравці, як $Goog, $meta, $techy, $baba та Bytedance, мають хороші позиції.
7. Нарахування вартості: У той же час, ми бачимо кишені по всьому стеку - особливо в інфраструктурі та додатках - де нові учасники можуть виділити великий бізнес (Так, вам потрібно буде прочитати фактичний звіт для будь-якої альфи, ледачої дупи)
8. Справжня мультимодальність Сьогодні відеомоделі виглядають як іграшка. Але відеодані та симуляції стають все більш важливими вхідними даними для довгострокових агентських завдань і для початку революції в робототехніці. Відеомоделі можуть просто довести іскру.
3,28K