Следующий рубеж ИИ — это не вычисления или большие модели, а лучшие данные. Сегодня мы представляем одного из немногих людей, который действительно посвятил свою жизнь решению этой проблемы. Добро пожаловать @SPChinchali, нашему новому директору по ИИ. Рубеж ИИ больше не определяется моделями с большим количеством параметров или вычислительными кластерами с большим количеством GPU. Он будет определяться нехваткой высококачественных, очищенных от прав данных из физического мира (подумайте о робототехнике, автономном оборудовании и устройствах на краю сети). Сандип всю свою карьеру преследовал этот рубеж. Теперь он помогает нам его открыть. Когда я впервые встретил Сандипа, меня поразило его мягкое, обаятельное отношение. У него есть способ говорить, который притягивает вас, независимо от того, объясняет ли он нейросимволический ИИ или восхваляет эргономичную клавиатуру, которая выглядит как инопланетная и которую он носит с собой куда бы ни пошел. Его опыт говорит сам за себя: докторская степень Стэнфорда, NASA JPL. Теперь он профессор в UT Austin, возглавляющий исследования на пересечении децентрализованного машинного обучения и робототехники. Сандип одержим тем, как получить полезные данные для обучения ИИ, чтобы сделать его полезным в реальном мире: > создание стимулов для данных для распределенных сетей, > решение классической проблемы выборки с длинным хвостом в робототехнике на краю сети, и > проектирование систем, которые сохраняют происхождение. Сандип также подтвердил тезис, которым я был одержим в течение многих лет: настоящая защита — это данные. Не собранные форумы Reddit или общий текст из Интернета, а атрибутируемые, очищенные от прав, данные из реального мира. Непредсказуемые данные, необходимые для того, чтобы сделать физические системы надежными, нельзя смоделировать. Это получение и курирование грязных, длинных данных, которые физические системы видят в дикой природе: скользящий робот на погрузочной платформе в 2 часа ночи, едва заметная микро-трещина на лопасти ветряной турбины, крайний случай, который блок lidar никогда не видел раньше. Эти моменты — это интеллектуальная собственность, и они ценны. Если мы сможем сделать эту интеллектуальную собственность программируемой, лицензируемой, отслеживаемой и монетизируемой в реальном времени, мы откроем маховик для каждой команды ИИ на планете. Программируемая интеллектуальная собственность — это единственная основа, которая делает это возможным. Большинство попыток объединить криптовалюту и ИИ прикрепляют "ИИ" к существующей инфраструктуре. Сандип присоединяется, потому что Story построен с нуля для решения таких задач координации данных. Story создан для динамичных, составных отношений. Наш протокол разработан для графовой основы происхождения, динамического лицензирования и автоматизированных потоков роялти, которые требуют современные системы ИИ. Фотография может быть лицензирована, ярлык может быть добавлен, синтетическая вариация может быть сгенерирована, и на Story каждое действие становится новым, связанным активом интеллектуальной собственности в прозрачном графе, с ценностью, возвращающейся каждому участнику. Приход Сандипа — это поворотный момент. Глава 2 Story начинает принимать форму, и следующая фаза инфраструктуры ИИ только начинается. Его сочетание глубокого интеллекта, искреннего любопытства и тихой преданности — это именно то, что требует этот момент. Мы не можем быть более взволнованными, чтобы строить будущее ИИ вместе с ним, и впереди нас ждет еще много интересного. Следите за новостями!
Sandeep Chinchali
Sandeep Chinchali17 июл., 23:00
Я провел свою карьеру, задаваясь одним вопросом: как нам собрать правильные данные, чтобы ИИ работал в реальном мире? От лабораторий Стэнфорда до классов в Техасском университете в Остине я искал повсюду. Ответ не в еще одной лаборатории ИИ, а в блокчейне, созданном для того, чтобы рассматривать данные как интеллектуальную собственность. Вот почему я присоединяюсь к @StoryProtocol в качестве их главного AI-офицера. В Стэнфорде я изучал "облачную робототехнику", как флоты роботов могут использовать распределенные вычисления для совместного обучения. Я даже установил видеорегистратор в своем автомобиле, чтобы решить эту задачу: Если роботы могут загружать только 5–10% того, что они видят, как нам выбрать самые ценные данные? Большая часть этого была скучной записью с автомагистрали. Но <1% запечатлело редкие сцены: самоуправляемые Waymo, строительные площадки, непредсказуемые люди. Эти данные с "длинным хвостом" делали модели умнее. Я вручную размечал их, даже платил сервису разметки Google Cloud, чтобы аннотировать мои записи с нишевыми концепциями, такими как "LIDAR-устройство" и "автономное транспортное средство", и обучал модели, которые работали на TPU размером с USB. Но академия имеет свои пределы. В Техасском университете в Остине мои вопросы изменились: → Как нам краудсорсить редкие данные для улучшения ML? → Какие системы стимулов действительно работают? Это привело меня в крипто – блокчейны, токеновые экономики, даже DePIN. Я вел блог, писал статьи о децентрализованном ML, но все еще задавался вопросом: кто на самом деле строит эту инфраструктуру? Совершенно случайно я встретил команду Story. Меня пригласили выступить с докладом в их офисе в Пало-Альто. Это было в 18:00, комната все еще была полна. Я болтал о "Нейро-символическом ИИ" и закончил слайдом под названием "Щепотка крипты". Этот доклад превратился в консультативную роль, которая теперь переросла во что-то гораздо большее. Мы находимся на переломном моменте. Вычисления в основном решены. Архитектуры моделей копируются за ночь. Настоящая преграда – данные. Не скопированные данные с Reddit. Не бесконечный язык. А данные с правами, длинного хвоста, реальные данные, которые обучают воплощенный ИИ – роботы, автономные транспортные средства, системы, которые ориентируются в нашем беспорядочном мире. Представьте это: я захватываю редкую сцену вождения на видеорегистратор и регистрирую ее в Story. Друг размечает ее. Агент ИИ создает синтетические варианты. На графовой цепочке Story каждый становится связанным с интеллектуальной собственностью. Роялти автоматически возвращаются. Все получают оплату, каждый шаг отслеживается в цепочке. Вот почему я теперь главный AI-офицер в Story, строя рельсы для децентрализованных, очищенных от прав данных для обучения. Пора сделать данные новой интеллектуальной собственностью. Story – это место, где это можно сделать. Скоро будет много нового. Поехали.
feedsImage
6,93K