Час від часу з'являється унікальний проект, який бере участь у власній гонці. Штучний інтелект здебільшого був нічим іншим, як терміналами в стилі chatgpt і творчою генерацією зображень/відео. Вже кілька місяців ми чуємо, що стоїмо на порозі того, що всі втратять роботу через штучний інтелект. Так, це зробило всіх 10-кратними за продуктивністю, але ми не повністю замінили людей у робочій силі. Чому? Домінуючі сьогодні асистенти штучного інтелекту, від чат-ботів у браузері до експериментальних «агентських» фреймворків, сильні в розмові, але структурно обмежені у виконанні. Зазвичай вони покладаються на браузер або просте середовище сценаріїв для виконання завдань. Хоча це працює для отримання інформації або базової веб-автоматизації, ці агенти борються зі складними, багатоетапними процесами і часто ламаються, коли речі відхиляються від свого обмеженого шляху. Нинішні агенти штучного інтелекту зазнають невдачі, тому що їм не вистачає постійної пам'яті та відмовостійкості, коли вони стикаються з несподіваними помилками, вони не можуть відновитися або адаптуватися, часто зупиняючись або зациклюючись на невизначений термін. Більшість із них працюють в обмежених середовищах на основі браузера та не мають доступу до повного спектру корпоративного програмного забезпечення, залишаючи рутинну роботу поза їхньою досяжністю. Ось чому ми не бачили, щоб штучний інтелект замінив повсякденні ролі компаній, такі як підтримка клієнтів та адміністрування. Не через відсутність можливостей у самих моделях штучного інтелекту, а тому, що фреймворки навколо них недостатньо надійні для критичних робочих процесів. Так що ж потрібно? Переосмислена архітектура системи. Такий, який стосується відмовостійкості, пам'яті, доступу, ізоляції та ефективності в єдиній структурі. Замість того, щоб зупинятися при першому несподіваному введенні, вони повинні виявляти помилки, адаптуватися та повторювати спроби різних методів, подібно до того, як це роблять люди, коли щось йде не так. Щоб масштабувати штучний інтелект у реальні робочі процеси, йому потрібна постійна пам'ять і відстеження завдань для надійної роботи протягом тривалого часу. Вони також вимагають повного доступу до екосистеми, крім інструментів браузера для використання того ж програмного забезпечення, що й люди, включаючи десктопні програми. Без надійної ізоляції агенти не можуть безпечно працювати в спеціалізованих середовищах, що робить широкомасштабне розгортання ризикованим через потенційне міжсистемне втручання. Якщо вони хочуть, щоб час їх роботи був стабільним і ефективним, їм також знадобиться розумне управління ресурсами, яке ставиться до комп'ютерів як до живого функціонуючого тіла. Для тих, хто з'єднав усі крапки, @Codecopenflow нещодавній реліз Fabric об'єднує все це, надаючи агентам штучного інтелекту надійні, повністю виділені операційні системи (ОС), які поєднують когнітивну потужність передових моделей з інфраструктурою, необхідною для функціонування як надійні цифрові працівники. Fabric сама по собі може бути повністю незалежним ліцензійним програмним забезпеченням. Він перетворює агентів зі скриптів, прив'язаних до браузера, на автономних операторів із повним доступом на рівні ОС. Подібно до того, як агрегатор DEX направляє вам найефективнішу ціну, Fabric є рівнем маршрутизації, який обслуговує глибокорівневу архітектуру Codec. Ви вказуєте свої потреби в процесорі, графічному процесорі, пам'яті та будь-яких налаштуваннях регіону. Це означає пошук найбільш економічно ефективних серверів, таких як AWS/google cloud або ресурси GPU від Render/IO net. Кодек надає чисті SDK та API для повного контролю над цими операторами штучного інтелекту. Компанія може інтегрувати агентів Codec у свій існуючий програмний конвеєр (наприклад, розгорнути агента для обробки запиту користувача, а потім розкрутити його) без необхідності перевинаходити свою інфраструктуру. У підтримці клієнтів агенти можуть керувати цілими робочими процесами, вирішенням запитів, оновленнями CRM, відшкодуваннями, знижуючи витрати на оплату праці до 90%, одночасно покращуючи стабільність і час безвідмовної роботи. Для бізнес-операцій Codec автоматизує повторювані адміністративні процеси, як-от обробка рахунків-фактур, оновлення кадрів і страхові вимоги, особливо в таких секторах, як фінанси та охорона здоров'я. Зосереджуючись на повністю ізольованому середовищі з кількома додатками для кожного оператора штучного інтелекту, штучний інтелект не обмежується критичними питаннями надійності та інтеграції, які попередні фреймворки не могли вирішити. По суті, перетворюючи інфраструктуру хмарних обчислень на гнучку складальну лінію для працівників зі штучним інтелектом. Кожен «працівник» отримує відповідні інструменти (додатки, ОС, доступ до даних) і ремінь безпеки (ізоляція + обробка несправностей) для виконання своєї роботи. Кожне вдосконалення моделей штучного інтелекту (GPT-5 тощо) лише збільшує цінність платформи Codec, тому що кращі «мізки» тепер можуть бути підключені до цього сильного «тіла» для виконання ще складніших завдань. Кодек не залежить від моделі (працює з будь-якою моделлю штучного інтелекту), тому він може отримати вигоду від загального прогресу штучного інтелекту, не будучи прив'язаним до долі одного постачальника. Ми перебуваємо в точці перегину, подібній до перших днів хмарних обчислень. Подібно до того, як компанії, які надали платформи для хмари (віртуалізація, інфраструктура AWS тощо), стали незамінними для корпоративних IT, компанія, яка надає платформу для роботи агентів штучного інтелекту, захопить величезний ринок. Компанія OpenAI вже випустила повністю агентичний термінал хмарного кодування під назвою Codex. Codex буде міні-локальною версією Codex, яку ви можете запустити на своєму комп'ютері, але що важливіше, основна модель Codex буде знаходитися в хмарі разом з його власним комп'ютером. Співзасновник OpenAI вважає, що найуспішнішими компаніями в майбутньому будуть ці два типи архітектури, об'єднані воєдино. Звучить знайомо. Що далі? Замість того, щоб розповідати, що буде далі, можливо, краще вказати на те, чого ми ще не бачили: - Немає підтвердженої корисності токена - Відсутність стимулів - Немає основної дорожньої карти - Без демонстрацій - Відсутність маркетплейсу - Мінімальні партнерські відносини Враховуючи, скільки знаходиться в розробці, разом з новими веб-сайтами, оновленими документами, більш глибокими пулами ліквідності, кампаніями спільноти/маркетингом і робототехнікою. Codec ще не розкрив багато карт. Звичайно, зараз на ринку може з'явитися більше готових продуктів на основі браузера, хоча скільки часу, поки вони не застаріють? Це інвестиція в напрямок штучного інтелекту та первинну архітектуру, яка замінить людську робочу силу. Кодек закодований.
Trissy
Trissy13 трав. 2025 р.
Віртуальні середовища для операторів-агентів: $CODEC Моя основна теза про вибух штучного інтелекту завжди зосереджувалася на зростанні кількості операторів. Але для того, щоб ці агенти досягли успіху, їм потрібен глибокий системний доступ, що фактично надає їм контроль над вашим персональним комп'ютером і конфіденційними даними, що створює серйозні проблеми з безпекою. Ми вже бачили, як такі компанії, як OpenAI та інші технологічні гіганти, обробляють дані користувачів. У той час як більшості людей все одно, люди, які отримують найбільшу вигоду від операторських агентів, 1% найбагатших абсолютно це роблять. Особисто я не маю шансів надати такій компанії, як OpenAI, повний доступ до своєї машини, навіть якщо це означатиме підвищення продуктивності на 10×. Так чому ж Codec? Архітектура Codec зосереджена на запуску ізольованих «хмарних робочих столів» на вимогу для агентів штучного інтелекту. В його основі лежить сервіс оркестрації на основі Kubernetes (кодова назва Captain), який надає легкі віртуальні машини (VM) у блоках Kubernetes. Кожен агент отримує власне ізольоване середовище на рівні ОС (повноцінний екземпляр ОС Linux), де він може запускати програми, браузери або будь-який код, повністю ізольований від інших агентів і хоста. Kubernetes керує плануванням, автоматичним масштабуванням та самовідновленням цих контейнерів агента, забезпечуючи надійність та можливість збільшувати/зменшувати багато екземплярів агента відповідно до навантаження Для захисту цих віртуальних машин використовуються довірені середовища виконання (TEE), що означає, що машина агента може бути криптографічно ізольована, її пам'ять і виконання можуть бути захищені від хостової ОС або постачальника хмарних послуг. Це має вирішальне значення для чутливих завдань: наприклад, віртуальна машина, що працює в анклаві, може надійно зберігати ключі API або секрети криптогаманця. Коли агенту штучного інтелекту («мозку» на основі LLM) потрібно виконати дії, він надсилає запити API до служби Captain, яка потім запускає або керує блоком віртуальної машини агента. Робочий процес: агент запитує машину, Капітан (через Kubernetes) виділяє под і приєднує постійний том (для диска ВМ). Потім агент може підключатися до своєї віртуальної машини (через захищений канал або потоковий інтерфейс) для виконання команд. Captain надає кінцеві точки, щоб агент міг виконувати команди оболонки, завантажувати/завантажувати файли, отримувати журнали та навіть робити знімки віртуальної машини для подальшого відновлення. Така конструкція дає агенту повноцінну операційну систему для роботи, але з контрольованим, перевіреним доступом. Оскільки він побудований на Kubernetes, Codec може автоматично масштабуватися по горизонталі, якщо 100 агентам потрібні середовища, він може запланувати 100 подів по всьому кластеру та обробляти збої, перезапускаючи модулі. Віртуальна машина агента може бути оснащена різними MCP-серверами (наприклад, «USB-портом» для ШІ). Наприклад, модуль Conductor від Codec – це контейнер, який запускає браузер Chrome разом із MCP-сервером Microsoft Playwright для керування браузером. Це дозволяє агенту штучного інтелекту відкривати веб-сторінки, переходити за посиланнями, заповнювати форми та вилучати контент за допомогою стандартних дзвінків MCP, ніби він є людиною, яка керує браузером. Інші інтеграції MCP можуть включати MCP файлової системи/терміналу (щоб дозволити агенту безпечно виконувати команди CLI) або MCP для конкретних додатків (для хмарних API, баз даних тощо). По суті, Codec надає «обгортки» інфраструктури (віртуальні машини, анклави, мережі), щоб плани агентів високого рівня могли безпечно виконуватися на реальному програмному забезпеченні та мережах. Випадки використання Автоматизація гаманця: Кодек може вбудовувати гаманці або ключі в віртуальну машину, захищену TEE, що дозволяє агенту штучного інтелекту взаємодіяти з блокчейн-мережами (торгувати на DeFi, керувати криптоактивами) без розкриття секретних ключів. Ця архітектура дозволяє ончейн-фінансовим агентам безпечно виконувати реальні транзакції, що було б дуже небезпечно в типовій конфігурації агентів. Слоган платформи прямо вказує підтримку «гаманців» як ключову можливість. Агент може, наприклад, запустити CLI для гаманця Ethereum у своєму анклаві, підписувати транзакції та надсилати їх із впевненістю, що якщо агент поводиться неправильно, він обмежується його віртуальною машиною, а ключі ніколи не залишають TEE. Автоматизація браузера та веб-сайту: Агенти CodecFlow можуть керувати повними веб-браузерами у своїй віртуальній машині. У прикладі Conductor показано, як агент запускає Chrome і транслює його екран на Twitch у режимі реального часу. За допомогою MCP Playwright агент може переміщатися по веб-сайтах, натискати кнопки та збирати дані так само, як людина-користувач. Це ідеально підходить для таких завдань, як веб-скрейпінг за логінами, автоматизовані веб-транзакції або тестування веб-додатків. Традиційні фреймворки зазвичай покладаються на виклики API або прості скрипти браузера без голови; навпаки, CodecFlow може запускати реальний браузер із видимим інтерфейсом користувача, що полегшує роботу зі складними веб-програмами (наприклад, із важкими завданнями JavaScript або CAPTCHA) під контролем штучного інтелекту. Автоматизація реального графічного інтерфейсу (застарілі системи): Оскільки кожен агент має реальну настільну ОС, він може автоматизувати застарілі програми з графічним інтерфейсом або сеанси віддаленого робочого столу, по суті, функціонуючи як роботизована автоматизація процесів (RPA), але керуючись штучним інтелектом. Наприклад, агент може відкрити електронну таблицю Excel у віртуальній машині Windows або взаємодіяти зі старою термінальною програмою, яка не має API. На сайті Codec прямо згадується включення «застарілої автоматизації». Це відкриває можливість використання штучного інтелекту для роботи з програмним забезпеченням, яке недоступне через сучасні API, завдання, яке було б дуже хакерським або небезпечним без обмеженого середовища. Включена інтеграція з noVNC передбачає, що агентів можна спостерігати або керувати за допомогою VNC, що корисно для моніторингу штучного інтелекту, який керує графічним інтерфейсом. Моделювання робочих процесів SaaS: Компанії часто стикаються зі складними процесами, які включають кілька SaaS-додатків або застарілих систем. наприклад, співробітник може взяти дані з Salesforce, об'єднати їх із даними з внутрішньої ERP-системи, а потім надіслати зведення клієнту електронною поштою. Кодек може дозволити агенту штучного інтелекту виконати всю цю послідовність, фактично увійшовши в ці програми через браузер або клієнтське програмне забезпечення у своїй віртуальній машині, подібно до того, як це зробила б людина. Це схоже на RPA, але працює на основі LLM, який може приймати рішення та обробляти варіативність. Важливо, що облікові дані цих додатків можуть бути надійно надані віртуальній машині (і навіть укладені в TEE), тому агент може використовувати їх, навіть не «бачачи» облікові дані у відкритому тексті та не розкриваючи їх ззовні. Це може прискорити автоматизацію рутинних завдань бек-офісу, одночасно задовольняючи ІТ, які кожен агент виконує з мінімальними привілеями та повною можливістю контролю (оскільки кожна дія у віртуальній машині може бути записана або записана). Дорожня карта - Запустіть публічну демоверсію в кінці місяця - Порівняння характеристик з іншими аналогічними платформами (немає конкурента web3) - Інтеграція з TAO - Велике ігрове партнерство З точки зору оригінальності, Codec побудований на основі існуючих технологій, але інтегрує їх новим способом для використання агентами штучного інтелекту. Ідея ізольованих середовищ виконання не нова (контейнери, віртуальні машини та TEE є стандартними в хмарних обчисленнях), але застосування їх до автономних агентів штучного інтелекту з безшовним рівнем API (MCP) є надзвичайно новим. Платформа використовує відкриті стандарти та інструменти скрізь, де це можливо: вона використовує MCP-сервери, такі як Microsoft Playwright, для керування браузером замість того, щоб заново винаходити це колесо, і планує підтримувати мікровіртуальні машини Firecracker від AWS для швидшої віртуалізації. Він також розширив існуючі рішення, такі як noVNC для потокових настільних комп'ютерів. Демонстрація того, що проєкт стоїть на фундаменті перевірених технологій (Kubernetes, анклавне обладнання, бібліотеки з відкритим вихідним кодом), зосереджуючи свій оригінальний розвиток на логіці клею та оркестровці («секретний соус» — це те, як все це працює разом). Поєднання компонентів з відкритим вихідним кодом і майбутнього хмарного сервісу (на що натякає згадка про утиліту $CODEC токенів і доступ до загальнодоступного продукту) означає, що Codec скоро буде доступний у різних формах (як у вигляді сервісу, так і на власному хостингу). Команда Moyai: 15+ років досвіду розробки, зараз очолює розробку штучного інтелекту в Elixir Games. lil'km: 5+ років розробник штучного інтелекту, зараз працює з HuggingFace над проектом LeRobot. HuggingFace — це величезна компанія-робототехніка, і Мояй працює керівником відділу штучного інтелекту в elixir games (за підтримки square enix і solanafdn). Я особисто обдзвонив по відеозв'язку з усією командою, і мені дуже подобається енергія, яку вони приносять. Мій друг, який привернув їх увагу до мене, також зустрівся з ними всіма на Token2049 і мав лише хороші речі. Заключні думки Попереду ще багато чого потрібно охопити, і я збережу для майбутніх оновлень і публікацій у своєму Telegram-каналі. Я давно вважав, що хмарна інфраструктура – це майбутнє за операторами. Я завжди з повагою ставився до того, що створює Nuit, але Codec — це перший проект, який показав мені впевненість у повному стеку, якого я так прагнув. Команда – це однозначно інженери найвищого рівня. Вони відкрито заявили, що маркетинг не є їхньою сильною стороною, і, ймовірно, саме тому це залишилося поза увагою. Я буду тісно співпрацювати з ними, щоб допомогти сформувати стратегію GTM, яка насправді відображає глибину того, що вони будують. З ринковою капіталізацією в $4 млн і таким рівнем інфраструктури він відчуває себе значно недооціненим. Якщо вони зможуть надати придатний для використання продукт, я думаю, це може легко ознаменувати початок наступного циклу штучного інтелекту. Як завжди, є ризик, і хоча я перевіряв команду непомітно протягом останніх кількох тижнів, жоден проект ніколи не є повністю захищеним. Цінові цілі? Набагато вище.
11,87K