Периодически появляется уникальный проект, который начинает свою собственную гонку. В основном ИИ был ничем иным, как терминалами в стиле chatgpt и генерацией креативных изображений/видео. Мы слышим уже несколько месяцев, что мы на грани того, чтобы все потеряли свои рабочие места из-за ИИ. Да, это увеличило продуктивность в 10 раз, но мы еще не полностью заменили людей в рабочей силе. Почему? Современные ИИ-ассистенты, от чат-ботов в браузере до экспериментальных "агентских" фреймворков, сильны в общении, но структурно ограничены в выполнении задач. Они обычно полагаются на браузер или простую среду сценариев для выполнения задач. Хотя это работает для получения информации или базовой веб-автоматизации, эти агенты испытывают трудности с комплексными многоступенчатыми процессами и часто ломаются, когда что-то отклоняется от их ограниченного пути. Современные ИИ-агенты терпят неудачу, потому что им не хватает постоянной памяти и устойчивости к сбоям; сталкиваясь с неожиданными ошибками, они не могут восстановиться или адаптироваться, часто застревая или зацикливаясь бесконечно. Большинство из них работает в ограниченных браузерных средах и не может получить доступ ко всему спектру корпоративного программного обеспечения, оставляя рутинную работу вне их досягаемости. Вот почему мы не видим, чтобы ИИ заменял рутинные роли в компаниях, такие как поддержка клиентов и администрирование. Не из-за отсутствия возможностей в самих моделях ИИ, а потому что фреймворки вокруг них недостаточно надежны для критических рабочих процессов. Так что же нужно? Переосмысленная архитектура системы. Та, которая решает проблемы устойчивости к сбоям, памяти, доступа, изоляции и эффективности в едином фреймворке. Вместо того чтобы застревать при первом неожиданном вводе, они должны улавливать ошибки, адаптироваться и пробовать разные методы, как это делают люди, когда что-то идет не так. Чтобы масштабировать ИИ в реальные рабочие процессы, ему нужна постоянная память и отслеживание задач для надежной работы на длительных сроках. Им также требуется полный доступ к экосистеме, выходящий за рамки инструментов браузера, чтобы использовать то же программное обеспечение, что и люди, включая настольные приложения. Без безопасной изоляции агенты не могут безопасно работать в выделенных средах, что делает развертывание в большом масштабе рискованным из-за потенциального перекрестного вмешательства систем. Если они хотят, чтобы их рабочее время было последовательным и эффективным, им также потребуется умное управление ресурсами, которое рассматривает компьютеры как живое функционирующее тело. Для тех, кто соединил точки, недавний релиз Fabric от @Codecopenflow объединяет все это, предоставляя ИИ-агентам надежные, полностью выделенные операционные системы (ОС), которые сочетают когнитивную мощь продвинутых моделей с инфраструктурой, необходимой для функционирования как надежные цифровые работники. Fabric сам по себе может быть полностью независимым лицензированным программным обеспечением. Он трансформирует агентов из скриптов, привязанных к браузеру, в автономных операторов с полным доступом на уровне ОС. Подобно тому, как агрегатор DEX направляет вам самую эффективную цену, Fabric является маршрутизирующим слоем, который обслуживает глубокую архитектуру Codec. Вы указываете свои потребности в ЦП, ГП, памяти и любые предпочтения по регионам. Это означает поиск самых экономически эффективных серверов, таких как AWS/google cloud, или ресурсов GPU от Render/IO net. Codec предоставляет чистые SDK и API для полного контроля над этими ИИ-операторами. Компания может интегрировать агентов Codec в свою существующую программную цепочку (например, запустить агента для обработки запроса пользователя, а затем отключить его), не требуя переосмыслять свою инфраструктуру. В поддержке клиентов агенты могут управлять целыми рабочими процессами, разрешением запросов, обновлениями CRM, возвратами, снижая затраты на труд до 90%, одновременно улучшая согласованность и время безотказной работы. Для бизнес-операций Codec автоматизирует повторяющиеся административные процессы, такие как обработка счетов, обновления HR и страховые претензии, особенно в секторах с высоким объемом, таких как финансы и здравоохранение. Сосредоточив внимание на полностью изолированной, многофункциональной среде для каждого ИИ-оператора, ИИ не ограничен критическими проблемами надежности и интеграции, которые предыдущие фреймворки не могли решить. По сути, превращая инфраструктуру облачных вычислений в гибкую сборочную линию для ИИ-работников. Каждый "работник" получает необходимые инструменты (приложения, ОС, доступ к данным) и защитный пояс (изоляция + обработка сбоев), чтобы выполнять свою работу. Каждое улучшение в моделях ИИ (GPT-5 и т.д.) только увеличивает ценность платформы Codec, потому что лучшие "мозги" теперь могут быть подключены к этому сильному "телу", чтобы выполнять еще более сложные задачи. Codec является модельно-агностичным (работает с любой моделью ИИ), поэтому он может извлечь выгоду из общего прогресса ИИ, не будучи привязанным к судьбе одного поставщика. Мы находимся на переломном моменте, аналогичном ранним дням облачных вычислений. Так же, как компании, предоставлявшие платформы для облака (виртуализация, инфраструктура AWS и т.д.), стали незаменимыми для корпоративной ИТ, компания, которая предоставит платформу для работы ИИ-агентов, захватит огромный рынок. OpenAI уже выпустила полностью агентный облачный кодировочный терминал под названием Codex. Codex будет мини-локальной версией Codex, которую вы можете запустить на своем компьютере, но, что более важно, основная модель Codex будет находиться в облаке с собственным компьютером. Соучредитель OpenAI считает, что самые успешные компании в будущем будут представлять собой эти два типа архитектуры, объединенные вместе. Звучит знакомо. Что дальше? Вместо того чтобы говорить вам, что будет дальше, возможно, лучше указать на то, чего мы еще не видели: - Нет подтвержденной полезности токена - Нет стимулов - Нет основной дорожной карты - Нет демонстраций - Нет рынка - Минимальные партнерства Учитывая, сколько всего в разработке, наряду с новыми веб-сайтами, обновленными документами, более глубокими ликвидными пулами, кампаниями сообщества/маркетинга и робототехникой. Codec еще не раскрыл много карт. Конечно, на рынке могут быть больше готовых продуктов на основе браузера, хотя как долго они будут актуальны? Это инвестиция в направление ИИ и основную архитектуру, которая заменит человеческие рабочие силы. Codec закодирован.
Trissy
Trissy13 мая 2025 г.
Виртуальные среды для операторских агентов: $CODEC Моя основная тезис вокруг взрыва ИИ всегда был сосредоточен на росте операторских агентов. Но для того, чтобы эти агенты добились успеха, им требуется глубокий доступ к системе, что фактически предоставляет им контроль над вашим персональным компьютером и конфиденциальными данными, что вызывает серьезные проблемы безопасности. Мы уже видели, как компании, такие как OpenAI и другие технологические гиганты, обрабатывают пользовательские данные. Хотя большинству людей это не важно, те, кто может извлечь наибольшую выгоду от операторских агентов, топ 1%, абсолютно заботятся об этом. Лично я не дам компании, такой как OpenAI, полный доступ к моему компьютеру, даже если это означает 10-кратное увеличение производительности. Так почему же Codec? Архитектура Codec сосредоточена на запуске изолированных, по требованию "облачных рабочих столов" для ИИ агентов. В его основе лежит оркестрационная служба на базе Kubernetes (кодовое имя Captain), которая предоставляет легковесные виртуальные машины (VM) внутри подов Kubernetes. Каждый агент получает свою собственную изолированную на уровне ОС среду (полноценный экземпляр Linux OS), где он может запускать приложения, браузеры или любой код, полностью изолированный от других агентов и хоста. Kubernetes управляет планированием, авто-масштабированием и самовосстановлением этих подов агентов, обеспечивая надежность и возможность увеличения/уменьшения количества экземпляров агентов в зависимости от нагрузки. Доверенные среды выполнения (TEE) используются для защиты этих VM, что означает, что машина агента может быть криптографически изолирована, ее память и выполнение могут быть защищены от хостовой ОС или облачного провайдера. Это важно для чувствительных задач: например, VM, работающая в анклаве, может безопасно хранить API-ключи или секреты криптокошелька. Когда ИИ агент ("мозг" на базе LLM) должен выполнить действия, он отправляет API-запросы в службу Captain, которая затем запускает или управляет подом VM агента. Рабочий процесс: агент запрашивает машину, Captain (через Kubernetes) выделяет под и прикрепляет постоянный том (для диска VM). Агент может затем подключиться к своей VM (через защищенный канал или потоковый интерфейс) для выполнения команд. Captain предоставляет конечные точки для агента для выполнения команд оболочки, загрузки/выгрузки файлов, получения журналов и даже создания снимка VM для последующего восстановления. Этот дизайн предоставляет агенту полноценную операционную систему для работы, но с контролируемым, аудируемым доступом. Поскольку он построен на Kubernetes, Codec может автоматически масштабироваться горизонтально, если 100 агентам нужны среды, он может запланировать 100 подов по всему кластеру и справляться с отказами, перезапуская поды. VM агента может быть оснащена различными MCP серверами (как "USB-порт" для ИИ). Например, модуль Conductor Codec - это контейнер, который запускает браузер Chrome вместе с сервером Microsoft Playwright MCP для управления браузером. Это позволяет ИИ агенту открывать веб-страницы, нажимать на ссылки, заполнять формы и извлекать контент через стандартные вызовы MCP, как если бы это был человек, управляющий браузером. Другие интеграции MCP могут включать файловую систему/терминал MCP (чтобы позволить агенту безопасно выполнять команды CLI) или специфические для приложений MCP (для облачных API, баз данных и т.д.). По сути, Codec предоставляет инфраструктурные "обертки" (VM, анклавы, сети), чтобы высокоуровневые планы агентов могли безопасно выполняться на реальном программном обеспечении и сетях. Сценарии использования Автоматизация кошелька: Codec может встроить кошельки или ключи внутри защищенной TEE VM, позволяя ИИ агенту взаимодействовать с блокчейн-сетями (торговать на DeFi, управлять криптоактивами) без раскрытия секретных ключей. Эта архитектура позволяет финансовым агентам на блокчейне выполнять реальные транзакции безопасно, что было бы очень опасно в типичной настройке агента. Слоган платформы явно указывает поддержку "кошельков" как ключевую возможность. Агент мог бы, например, запустить CLI для Ethereum кошелька внутри своего анклава, подписывать транзакции и отправлять их, с уверенностью, что если агент ведет себя неправильно, он ограничен своей VM и ключи никогда не покидают TEE. Автоматизация браузера и веба: Агенты CodecFlow могут управлять полными веб-браузерами в своей VM. Пример Conductor демонстрирует, как агент запускает Chrome и транслирует его экран на Twitch в реальном времени. Через Playwright MCP агент может навигировать по сайтам, нажимать кнопки и извлекать данные так же, как и человек. Это идеально для задач, таких как веб-скрейпинг за логинами, автоматизированные веб-транзакции или тестирование веб-приложений. Традиционные фреймворки обычно полагаются на API-вызовы или простые скрипты безголовых браузеров; в отличие от этого, CodecFlow может запускать реальный браузер с видимым интерфейсом, что облегчает работу с сложными веб-приложениями (например, с тяжелым JavaScript или CAPTCHA) под управлением ИИ. Автоматизация реальных GUI (наследственные системы): Поскольку у каждого агента есть настоящая настольная ОС, он может автоматизировать наследственные GUI приложения или сеансы удаленного рабочего стола, фактически функционируя как автоматизация роботизированных процессов (RPA), но управляемая ИИ. Например, агент мог бы открыть электронную таблицу Excel в своей Windows VM или взаимодействовать со старым терминальным приложением, у которого нет API. Сайт Codec упоминает возможность "наследственной автоматизации" явно. Это открывает использование ИИ для работы с программным обеспечением, которое недоступно через современные API, задача, которая была бы очень сложной или небезопасной без изолированной среды. Включенная интеграция noVNC предполагает, что агенты могут наблюдаться или управляться через VNC, что полезно для мониторинга ИИ, управляющего GUI. Симуляция рабочих процессов SaaS: Компании часто имеют сложные процессы, которые включают несколько приложений SaaS или наследственные системы. Например, сотрудник может взять данные из Salesforce, объединить их с данными из внутренней ERP, а затем отправить клиенту сводку по электронной почте. Codec может позволить ИИ агенту выполнить всю эту последовательность, фактически входя в эти приложения через браузер или клиентское программное обеспечение в своей VM, как это сделал бы человек. Это похоже на RPA, но с поддержкой LLM, который может принимать решения и справляться с изменчивостью. Важно, что учетные данные для этих приложений могут быть предоставлены VM безопасно (и даже заключены в TEE), чтобы агент мог использовать их, не "видя" открытые учетные данные или не раскрывая их внешне. Это может ускорить автоматизацию рутинных задач бэк-офиса, удовлетворяя ИТ, что каждый агент работает с минимальными привилегиями и полной аудируемостью (поскольку каждое действие в VM может быть записано или зафиксировано). Дорожная карта - Запуск публичной демонстрации в конце месяца - Сравнение функций с другими аналогичными платформами (нет конкурента в web3) - Интеграция TAO - Крупное партнерство в игровой индустрии С точки зрения оригинальности, Codec построен на основе существующих технологий, но интегрирует их новым способом для использования ИИ агентов. Идея изолированных сред выполнения не нова (контейнеры, VM и TEE являются стандартом в облачных вычислениях), но применение их к автономным ИИ агентам с бесшовным API слоем (MCP) является крайне новаторским. Платформа использует открытые стандарты и инструменты, где это возможно: она использует MCP серверы, такие как Playwright от Microsoft для управления браузером, вместо того, чтобы изобретать это колесо заново, и планирует поддерживать микро-VM Firecracker от AWS для более быстрой виртуализации. Она также форкнула существующие решения, такие как noVNC для потоковой передачи рабочих столов. Это демонстрирует, что проект стоит на основах проверенных технологий (Kubernetes, аппаратное обеспечение анклавов, библиотеки с открытым исходным кодом), сосредотачивая свое оригинальное развитие на логике "клея" и оркестрации ("секретный соус" - это то, как все это работает вместе). Комбинация компонентов с открытым исходным кодом и предстоящей облачной службы (намек на упоминание утилиты токена $CODEC и публичного доступа к продукту) означает, что Codec вскоре будет доступен в нескольких формах (как услуга и самохостинг). Команда Moyai: более 15 лет опыта разработки, в настоящее время возглавляет разработку ИИ в Elixir Games. lil’km: более 5 лет разработчик ИИ, в настоящее время работает с HuggingFace над проектом LeRobot. HuggingFace - это крупная робототехническая компания, а Moyai работает в качестве главы ИИ в Elixir Games (поддерживается Square Enix и solanafdn). Я лично общался с всей командой по видеосвязи и действительно понравилась энергия, которую они привносят. Мой друг, который поставил их на мой радар, также встретился с ними на Token2049 и только хорошо отзывался о них. Заключительные мысли Еще многое предстоит обсудить, что я сохраню для будущих обновлений и постов в моем Telegram-канале. Я давно верю, что облачная инфраструктура - это будущее для операторских агентов. Я всегда уважал то, что строит Nuit, но Codec - это первый проект, который показал мне полную уверенность в стеке, которую я искал. Команда явно топовые инженеры. Они открыто заявили, что маркетинг не их сильная сторона, что, вероятно, является причиной, почему это прошло незамеченным. Я буду тесно работать с ними, чтобы помочь сформировать стратегию GTM, которая действительно отражает глубину того, что они строят. С рыночной капитализацией в $4 млн и таким уровнем инфраструктуры, это кажется сильно недооцененным. Если они смогут предоставить пригодный для использования продукт, я думаю, это может легко ознаменовать начало следующего цикла инфраструктуры ИИ. Как всегда, есть риск, и хотя я проверял команду в тайне в течение последних нескольких недель, ни один проект никогда не является полностью защищенным от мошенничества. Целевые цены? Намного выше.
11,85K