Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Virtuální prostředí pro agenty operátorů: $CODEC
Moje hlavní teze týkající se exploze umělé inteligence se vždy soustředila na vzestup operátorských agentů.
Aby však tito agenti uspěli, vyžadují hluboký přístup k systému, který jim účinně poskytuje kontrolu nad vaším osobním počítačem a citlivými daty, což přináší vážné bezpečnostní problémy.
Už jsme viděli, jak společnosti jako OpenAI a další technologičtí giganti zacházejí s uživatelskými daty. Zatímco většině lidí je to jedno, jednotlivci, kteří mají největší prospěch z agentů operátorů, horní 1 % rozhodně ano.
Osobně je nulová šance, že společnosti jako OpenAI poskytnu plný přístup k mému počítači, i když to znamená 10× zvýšení produktivity.
Tak proč kodek?
Architektura Codecu je zaměřena na spouštění izolovaných "cloudových desktopů" na vyžádání pro agenty AI. Jeho jádrem je orchestrační služba založená na Kubernetes (kódové označení Captain), která poskytuje odlehčené virtuální stroje (VM) uvnitř podů Kubernetes.
Každý agent získá vlastní izolované prostředí na úrovni operačního systému (úplnou instanci operačního systému Linux), kde může spouštět aplikace, prohlížeče nebo jakýkoli kód, zcela izolovaný od ostatních agentů a hostitele. Kubernetes se stará o plánování, automatické škálování a automatické opravy těchto podů agentů, což zajišťuje spolehlivost a schopnost spouštět / vypínat mnoho instancí agentů podle požadavků zatížení
K zabezpečení těchto virtuálních počítačů se používají důvěryhodná spouštěcí prostředí (TEE), což znamená, že počítač agenta může být kryptograficky izolován, jeho paměť a spuštění mohou být chráněny před hostitelským operačním systémem nebo poskytovatelem cloudu. To je zásadní pro citlivé úlohy: například virtuální počítač běžící v enklávě by mohl bezpečně uchovávat klíče API nebo tajemství kryptopeněženky.
Když agent AI ("mozek") potřebuje provést akce, odešle požadavky API službě Captain, která pak spustí nebo spravuje pod. Pracovní postup: agent si vyžádá počítač, Captain (prostřednictvím Kubernetes) přidělí pod a připojí trvalý svazek (pro disk virtuálního počítače). Agent se pak může připojit ke svému virtuálnímu počítači (prostřednictvím zabezpečeného kanálu nebo rozhraní streamování) a vydávat příkazy. Captain zpřístupňuje koncové body, aby agent mohl provádět příkazy prostředí, nahrávat/stahovat soubory, načítat protokoly a dokonce pořizovat snímky virtuálního počítače pro pozdější obnovení.
Tento návrh poskytuje agentovi úplný operační systém, ve kterém může pracovat, ale s řízeným, auditovaným přístupem. Vzhledem k tomu, že je kodek postavený na Kubernetes, může se automaticky škálovat horizontálně, pokud 100 agentů potřebuje prostředí, může naplánovat 100 podů v celém clusteru a řešit selhání restartováním podů.
Virtuální počítač agenta může být vybaven různými MCP servery (například "USB port" pro AI). Například modul Conductor kodeku je kontejner, který spouští prohlížeč Chrome spolu se serverem Microsoft Playwright MCP pro ovládání prohlížeče. To umožňuje agentovi umělé inteligence otevírat webové stránky, klikat na odkazy, vyplňovat formuláře a škrábat obsah prostřednictvím standardních volání MCP, jako by to byl člověk, který ovládá prohlížeč.
Další integrace MCP mohou zahrnovat MCP souborového systému/terminálu (aby agent mohl bezpečně spouštět příkazy CLI) nebo MCP specifické pro aplikaci (pro cloudová rozhraní API, databáze atd.). Kodek v podstatě poskytuje infrastrukturní "obaly" (VM, enklávy, sítě), aby bylo možné bezpečně provádět plány agentů na vysoké úrovni na skutečném softwaru a sítích.
Případy použití
Automatizace peněženky:
Kodek může vložit peněženky nebo klíče do virtuálního počítače chráněného TEE, což umožňuje agentovi AI komunikovat s blockchainovými sítěmi (obchodovat na DeFi, spravovat krypto aktiva) bez odhalení tajných klíčů.
Tato architektura umožňuje onchain finančním agentům, kteří bezpečně provádějí skutečné transakce, což by v typickém nastavení agenta bylo velmi nebezpečné. Slogan platformy výslovně uvádí podporu pro "peněženky" jako klíčovou schopnost.
Agent by například mohl spustit CLI pro peněženku Ethereum uvnitř své enklávy, podepisovat transakce a odesílat je s jistotou, že pokud se agent chová špatně, je omezen na jeho virtuální počítač a klíče nikdy neopustí TEE.
Automatizace prohlížeče a webu:
Agenti CodecFlow mohou ve svém virtuálním počítači ovládat úplné webové prohlížeče. Příklad Conductor ukazuje agenta, který spouští Chrome a v reálném čase streamuje jeho obrazovku do Twitche. Prostřednictvím Playwright MCP může agent procházet webové stránky, klikat na tlačítka a škrábat data stejně jako lidský uživatel. To je ideální pro úkoly, jako je škrábání webu za přihlášením, automatizované webové transakce nebo testování webových aplikací.
Tradiční frameworky se obvykle spoléhají na volání API nebo jednoduché bezhlavé skripty prohlížeče; naproti tomu CodecFlow může spustit skutečný prohlížeč s viditelným uživatelským rozhraním, což usnadňuje manipulaci se složitými webovými aplikacemi (např. s velkými výzvami JavaScript nebo CAPTCHA) pod kontrolou AI.
Automatizace GUI v reálném světě (starší systémy):
Vzhledem k tomu, že každý agent má skutečný desktopový operační systém, může automatizovat starší aplikace s grafickým uživatelským rozhraním nebo relace vzdálené plochy, které v podstatě fungují jako robotická automatizace procesů (RPA), ale jsou řízeny umělou inteligencí. Agent může například otevřít excelovou tabulku na svém virtuálním počítači s Windows nebo rozhraní se starou terminálovou aplikací, která nemá žádné rozhraní API.
Stránka Codecu výslovně zmiňuje povolení "starší automatizace". To otevírá cestu k ovládání softwaru, který není přístupný prostřednictvím moderních rozhraní API, což je úkol, který by byl bez uzavřeného prostředí velmi hacknutý nebo nebezpečný. Zahrnutá integrace noVNC naznačuje, že agenty lze pozorovat nebo ovládat prostřednictvím VNC, což je užitečné pro monitorování umělé inteligence, která řídí GUI.
Simulace pracovních postupů SaaS:
Společnosti mají často složité procesy, které zahrnují více aplikací SaaS nebo starších systémů. Zaměstnanec může například převzít data ze Salesforce, zkombinovat je s daty z interního ERP a poté odeslat souhrn e-mailem klientovi. Kodek může agentovi umělé inteligence umožnit provést celou tuto sekvenci tím, že se do těchto aplikací skutečně přihlásí prostřednictvím prohlížeče nebo klientského softwaru ve svém virtuálním počítači, podobně jako by to udělal člověk. Je to jako RPA, ale poháněné LLM, které dokáže rozhodovat a zvládat variabilitu.
Důležité je, že přihlašovací údaje k těmto aplikacím je možné virtuálnímu počítači poskytnout bezpečně (a dokonce je uzavřít do TEE), takže je agent může používat, aniž by kdy "viděl" přihlašovací údaje ve formátu prostého textu nebo je vystavil externě. To by mohlo urychlit automatizaci rutinních úloh back office a zároveň uspokojit IT, že každý agent běží s nejmenšími oprávněními a plnou auditovatelností (protože každou akci ve virtuálním počítači lze zaznamenat nebo zaznamenat).
Plán
- Spustit veřejné demo na konci měsíce
- Srovnání funkcí s jinými podobnými platformami (žádný konkurent web3)
- Integrace TAO
- Velké herní partnerství
Pokud jde o originalitu, Codec je postaven na základech stávajících technologií, ale integruje je novým způsobem pro použití agentů AI. Myšlenka izolovaných prováděcích prostředí není nová (kontejnery, virtuální počítače a TEE jsou standardem v cloud computingu), ale jejich použití na autonomní agenty AI s bezproblémovou vrstvou API (MCP) je extrémně nové.
Platforma využívá otevřené standardy a nástroje, kdykoli je to možné: používá servery MCP, jako je Playwright od Microsoftu, pro ovládání prohlížeče namísto vynalézání tohoto kola a plánuje podporovat mikro-VM Firecracker od AWS pro rychlejší virtualizaci. Také rozvětvil stávající řešení, jako je noVNC pro streamování desktopů. Demonstrace toho, že projekt stojí na základech osvědčené technologie (Kubernetes, enclave hardware, open-source knihovny) a zaměřuje se na původní vývoj na glue logic a orchestraci ("tajná omáčka" je způsob, jakým to všechno funguje dohromady).
Kombinace open-source komponent a nadcházející cloudové služby (naznačená zmínkou o nástroji pro $CODEC token a veřejném přístupu k produktům) znamená, že Codec bude brzy přístupný v různých formách (jak jako služba, tak jako self-hosting).
Tým
Moyai: 15+ let zkušeností s vývojem, v současné době vede vývoj umělé inteligence ve společnosti Elixir Games.
lil'km: 5+ let vývojáře AI, v současné době spolupracuje s HuggingFace na projektu LeRobot.
HuggingFace je obrovská robotická společnost a Moyai pracuje jako šéf umělé inteligence ve společnosti elixir games (za kterou stojí Square Enix a solanafdn.
Osobně jsem videohovor s celým týmem a opravdu se mi líbí energie, kterou přinášejí. Můj přítel, který je dal do mého radaru, se s nimi všemi setkal na Token2049 a měl jen dobré věci, které mohl říct.
Závěrečné myšlenky
Zbývá toho ještě hodně, co si nechám pro budoucí aktualizace a příspěvky na svém kanálu Telegram.
Dlouho jsem věřil, že cloudová infrastruktura je budoucností agentů operátorů. Vždy jsem respektoval to, co Nuit buduje, ale Codec je první projekt, který mi ukázal plné přesvědčení, které jsem hledal.
Tým jsou jednoznačně špičkoví inženýři. Otevřeně řekli, že marketing není jejich silnou stránkou, což je pravděpodobně důvod, proč to uniklo pozornosti. Budu s nimi úzce spolupracovat, abych jim pomohl utvářet strategii GTM, která skutečně odráží hloubku toho, co budují.
S tržní kapitalizací 4 miliony dolarů a touto úrovní infrastruktury působí masivně podhodnoceně. Pokud dokážou dodat použitelný produkt, myslím, že by to mohlo snadno znamenat začátek dalšího cyklu infra AI.
Jako vždy, je tu riziko, a i když jsem tým v posledních několika týdnech prověřil v tajnosti, žádný projekt není nikdy zcela odolný proti kobercům.
Cílové ceny? Mnohem vyšší.

21,28K
Top
Hodnocení
Oblíbené