Я провел свою карьеру, задаваясь одним вопросом: как нам собрать правильные данные, чтобы ИИ работал в реальном мире? От лабораторий Стэнфорда до классов в Техасском университете в Остине я искал повсюду. Ответ не в еще одной лаборатории ИИ, а в блокчейне, созданном для того, чтобы рассматривать данные как интеллектуальную собственность. Вот почему я присоединяюсь к @StoryProtocol в качестве их главного AI-офицера. В Стэнфорде я изучал "облачную робототехнику", как флоты роботов могут использовать распределенные вычисления для совместного обучения. Я даже установил видеорегистратор в своем автомобиле, чтобы решить эту задачу: Если роботы могут загружать только 5–10% того, что они видят, как нам выбрать самые ценные данные? Большая часть этого была скучной записью с автомагистрали. Но <1% запечатлело редкие сцены: самоуправляемые Waymo, строительные площадки, непредсказуемые люди. Эти данные с "длинным хвостом" делали модели умнее. Я вручную размечал их, даже платил сервису разметки Google Cloud, чтобы аннотировать мои записи с нишевыми концепциями, такими как "LIDAR-устройство" и "автономное транспортное средство", и обучал модели, которые работали на TPU размером с USB. Но академия имеет свои пределы. В Техасском университете в Остине мои вопросы изменились: → Как нам краудсорсить редкие данные для улучшения ML? → Какие системы стимулов действительно работают? Это привело меня в крипто – блокчейны, токеновые экономики, даже DePIN. Я вел блог, писал статьи о децентрализованном ML, но все еще задавался вопросом: кто на самом деле строит эту инфраструктуру? Совершенно случайно я встретил команду Story. Меня пригласили выступить с докладом в их офисе в Пало-Альто. Это было в 18:00, комната все еще была полна. Я болтал о "Нейро-символическом ИИ" и закончил слайдом под названием "Щепотка крипты". Этот доклад превратился в консультативную роль, которая теперь переросла во что-то гораздо большее. Мы находимся на переломном моменте. Вычисления в основном решены. Архитектуры моделей копируются за ночь. Настоящая преграда – данные. Не скопированные данные с Reddit. Не бесконечный язык. А данные с правами, длинного хвоста, реальные данные, которые обучают воплощенный ИИ – роботы, автономные транспортные средства, системы, которые ориентируются в нашем беспорядочном мире. Представьте это: я захватываю редкую сцену вождения на видеорегистратор и регистрирую ее в Story. Друг размечает ее. Агент ИИ создает синтетические варианты. На графовой цепочке Story каждый становится связанным с интеллектуальной собственностью. Роялти автоматически возвращаются. Все получают оплату, каждый шаг отслеживается в цепочке. Вот почему я теперь главный AI-офицер в Story, строя рельсы для децентрализованных, очищенных от прав данных для обучения. Пора сделать данные новой интеллектуальной собственностью. Story – это место, где это можно сделать. Скоро будет много нового. Поехали.
feedsImage
32,5K