Просто сделай себе одолжение и прочитай объяснение Трисси о том, почему @codecopenflow — одна из лучших ставок для операторов ИИ. OpenAI только что выпустила своего агента-оператора, так что ясно, что крупные игроки тоже работают над VLA. Все еще высокий риск, но стратосфера — это чертов потолок для этого.
Trissy
Trissy18 июл., 16:10
OpenAI только что подтвердил мою северную звезду тезис для ИИ, выпустив своего оператора-агента. Это не только был мой руководящий тезис для $CODEC, но и для всех других инвестиций в ИИ, которые я сделал, включая те, что были сделаны ранее в этом году во время мании ИИ. С Codec было много обсуждений относительно робототехники, и хотя этот вертикаль скоро будет иметь свою собственную нарратив, основная причина, по которой я был так оптимистичен по поводу Codec с первого дня, заключается в том, как его архитектура поддерживает операторов-агентов. Люди все еще недооценивают, сколько доли рынка на кону, создавая программное обеспечение, которое работает автономно, превосходя человеческих работников без необходимости в постоянных подсказках или контроле. Я видел много сравнений с $NUIT. Прежде всего, я хочу сказать, что я большой поклонник того, что строит Nuit, и желаю им только успеха. Если вы наберете "nuit" в моем телеграме, вы увидите, что в апреле я сказал, что если бы мне пришлось держать одну монету в течение нескольких месяцев, это была бы Nuit из-за моего операционного тезиса. Nuit был самым многообещающим операторским проектом на бумаге, но после обширного исследования я обнаружил, что их архитектура не имеет глубины, необходимой для оправдания крупной инвестиции или поддержки своей репутации. С учетом этого, я уже знал о архитектурных пробелах в существующих командах операторов-агентов и активно искал проект, который бы их устранял. Вскоре после этого появился Codec (благодаря @0xdetweiler, который настаивал, чтобы я глубже изучил их), и вот в чем разница между двумя: $CODEC против $NUIT Архитектура Codec построена на трех уровнях: Машина, Система и Интеллект, которые разделяют инфраструктуру, интерфейс окружения и ИИ-логику. Каждый оператор-агент в Codec работает в своем собственном изолированном виртуальном машине или контейнере, что позволяет достичь почти нативной производительности и изоляции ошибок. Этот многослойный дизайн означает, что компоненты могут масштабироваться или развиваться независимо, не нарушая систему. Архитектура Nuit идет другим путем, будучи более монолитной. Их стек вращается вокруг специализированного веб-браузерного агента, который сочетает парсинг, ИИ-рассуждение и действия. Это означает, что они глубоко парсят веб-страницы в структурированные данные для потребления ИИ и полагаются на облачную обработку для тяжелых задач ИИ. Подход Codec к внедрению легкой модели Vision-Language-Action (VLA) в каждом агенте означает, что она может работать полностью локально. Это не требует постоянного обращения к облаку за инструкциями, что сокращает задержку и избегает зависимости от времени работы и пропускной способности. Агент Nuit обрабатывает задачи, сначала преобразуя веб-страницы в семантический формат, а затем используя мозг LLM, чтобы понять, что делать, что со временем улучшается с помощью обучения с подкреплением. Хотя это эффективно для веб-автоматизации, этот поток зависит от тяжелой облачной обработки ИИ и предопределенных структур страниц. Локальный интеллект устройства Codec означает, что решения принимаются ближе к данным, что снижает накладные расходы и делает систему более стабильной к неожиданным изменениям (без хрупких скриптов или предположений о DOM). Операторы Codec следуют непрерывному циклу восприятия–мышления–действия. Машинный уровень передает окружение (например, живое приложение или поток робота) на уровень интеллекта через оптимизированные каналы уровня системы, давая ИИ "глаза" на текущее состояние. Модель VLA агента затем интерпретирует визуальные данные и инструкции вместе, чтобы решить, какое действие предпринять, которое уровень системы выполняет через события клавиатуры/мыши или управление роботом. Этот интегрированный цикл означает, что он адаптируется к живым событиям, даже если интерфейс пользователя меняется, вы не нарушите поток. Чтобы объяснить все это более простым аналогом, подумайте о операторах Codec как о самодостаточном сотруднике, который адаптируется к неожиданностям на работе. Агент Nuit похож на сотрудника, которому нужно остановиться, описать ситуацию супервайзеру по телефону и ждать инструкций. Не углубляясь слишком сильно в технические детали, это должно дать вам общее представление о том, почему я выбрал Codec как свою основную ставку на операторов. Да, Nuit имеет поддержку от YC, сильную команду и уровень S на github. Хотя архитектура Codec была построена с учетом горизонтального масштабирования, что означает, что вы можете развернуть тысячи агентов параллельно без общей памяти или контекста выполнения между агентами. Команда Codec тоже не средние разработчики. Их архитектура VLA открывает множество вариантов использования, которые были невозможны с предыдущими моделями агентов из-за способности видеть через пиксели, а не скриншоты. Я мог бы продолжать, но оставлю это для будущих постов.
1,91K