Я провів свою кар'єру, переслідуючи одне питання: як ми можемо збирати правильні дані, щоб штучний інтелект працював у реальному світі? Від лабораторій Стенфорда до аудиторій Техаського університету в Остіні – я шукав усюди. Відповідь полягає не в іншій лабораторії штучного інтелекту, а в блокчейні, створеному для обробки даних як інтелектуальної власності. Ось чому я приєднуюсь до @StoryProtocol як їхній директор зі штучного інтелекту. У Стенфорді я вивчав «хмарну робототехніку», тобто те, як флоти роботів можуть використовувати розподілені обчислення для спільного навчання. Я навіть встановив відеореєстратор у своїй машині, щоб вирішити це: Якщо роботи можуть завантажувати лише 5–10% того, що вони бачать, як ми можемо вибрати найцінніші дані? Більша його частина була нудною зйомкою на автостраді. Але <1% зафіксували рідкісні сцени: безпілотні Waymos, будівельні майданчики, непередбачувані люди. Ці «довгохвості» дані зробили моделі розумнішими. Я позначив його вручну, навіть оплатив сервіс маркування Google Cloud, щоб він анотував мої кадри вузькоспеціалізованими поняттями, такими як «блок LIDAR» і «автономний транспортний засіб», а також тренував моделі, які працювали на TPU розміром з USB. Але академічні кола заходять лише так далеко. У Техаському університеті в Остіні мої запитання змістилися: → Як ми здійснюємо краудсорсинг рідкісних даних для покращення машинного навчання? → Які системи стимулювання насправді працюють? Це привело мене до криптовалюти – блокчейнів, економіки токенів, навіть DePIN. Я вів блоги, писав статті про децентралізоване машинне навчання, але все одно задавався питанням: хто насправді будує цю інфраструктуру? Абсолютно випадково я познайомився з командою «Історії». Мене запросили виступити з доповіддю в їхньому офісі в Пало-Альто. Була 6 вечора, номер ще забитий. Я поміркував про «Нейросимволічний штучний інтелект» і закінчив слайдом під назвою «Дещиця криптовалюти». Ця розмова перетворилася на консультативну роль, яка тепер перетворилася на щось набагато більше. Ми перебуваємо в переломному моменті. Обчислення в основному вирішується. Архітектури моделей копіюються за одну ніч. Реальний рів – це дані. Чи не вибраний Reddit. Не нескінченна мова. Але очищені від прав, з довгим хвостом, реальні дані, які тренують втілений штучний інтелект – роботів, аудіовіруси, системи, які орієнтуються в нашому безладному світі. Уявіть собі: я знімаю рідкісну сцену водіння на відеореєстратор і реєструю її в Story. Друг вішає на це ярлик. Агент штучного інтелекту створює синтетичні варіанти. У ланцюжку Сторі, структурованому графом, кожен з них стає пов'язаним IP. Роялті повертаються автоматично. Кожен отримує гроші, кожен крок відстежується в мережі. Ось чому я зараз обіймаю посаду директора зі штучного інтелекту в Story, який створює рейки для децентралізованих навчальних даних, очищених IP. Настав час зробити дані новою IP-адресою. Історія – це місце, де це можна зробити. Скоро буде набагато більше. Пішли.
feedsImage
31,74K