Doe jezelf gewoon een plezier en lees Trissy's uitleg over waarom @codecopenflow een van de beste inzetten is voor AI-operators. OpenAI heeft zojuist hun Operators-agent uitgebracht, dus het is duidelijk dat de grote spelers ook aan VLA's werken. Het blijft een hoog risico, maar de stratosfeer is het fooking plafond voor deze.
Trissy
Trissy18 jul, 16:10
OpenAI heeft vandaag mijn noordelijke sterthese voor AI bevestigd door hun operatoragent vrij te geven. Dit was niet alleen mijn leidende these voor $CODEC, maar ook voor elke andere AI-investering die ik heb gedaan, inclusief die van eerder dit jaar tijdens de AI-manie. Er is veel discussie geweest met Codec met betrekking tot Robotica, terwijl die verticale binnenkort zijn eigen verhaal zal hebben, is de onderliggende reden waarom ik vanaf dag 1 zo optimistisch was over Codec, vanwege hoe de architectuur operatoragents aanstuurt. Mensen onderschatten nog steeds hoeveel marktaandeel op het spel staat door software te bouwen die autonoom draait, menselijke werknemers overtreft zonder de noodzaak voor constante aansturing of toezicht. Ik heb veel vergelijkingen gezien met $NUIT. Ten eerste wil ik zeggen dat ik een grote fan ben van wat Nuit aan het bouwen is en wens niets dan succes voor hen. Als je "nuit" in mijn telegram typt, zie je dat ik in april zei dat als ik één munt meerdere maanden moest vasthouden, het Nuit zou zijn vanwege mijn operatorthese. Nuit was het meest veelbelovende operatorproject op papier, maar na uitgebreid onderzoek ontdekte ik dat hun architectuur de diepgang miste die nodig was om een grote investering te rechtvaardigen of mijn reputatie erachter te zetten. Met dit in gedachten was ik me al bewust van de architecturale hiaten in bestaande operatoragentteams en actief op zoek naar een project dat deze aanpakte. Kort nadat Codec verscheen (dank aan @0xdetweiler die aandrong dat ik dieper naar hen keek) en dit is het verschil tussen de twee: $CODEC vs $NUIT De architectuur van Codec is opgebouwd uit drie lagen; Machine, Systeem en Intelligentie, die infrastructuur, omgevingsinterface en AI-logica scheiden. Elke operatoragent in Codec draait in zijn eigen geïsoleerde VM of container, wat bijna native prestaties en foutisolatie mogelijk maakt. Dit gelaagde ontwerp betekent dat componenten onafhankelijk kunnen schalen of evolueren zonder het systeem te breken. De architectuur van Nuit volgt een andere weg door meer monolithisch te zijn. Hun stack draait om een gespecialiseerde webbrowseragent die parseren, AI-redenering en actie combineert. Dit betekent dat ze webpagina's diepgaand parseren in gestructureerde gegevens voor de AI om te consumeren en afhankelijk zijn van cloudverwerking voor zware AI-taken. De aanpak van Codec om een lichtgewicht Vision-Language-Action (VLA) model binnen elke agent in te bedden, betekent dat het volledig lokaal kan draaien. Dit vereist geen constante terugkoppeling naar de cloud voor instructies, waardoor latentie wordt verminderd en afhankelijkheid van uptime en bandbreedte wordt vermeden. De agent van Nuit verwerkt taken door eerst webpagina's om te zetten in een semantisch formaat en vervolgens een LLM-brein te gebruiken om te bepalen wat te doen, wat in de loop van de tijd verbetert met versterkend leren. Hoewel effectief voor webautomatisering, hangt deze stroom af van zware cloudzijde AI-verwerking en vooraf gedefinieerde paginstructuren. De lokale apparaatintelligentie van Codec betekent dat beslissingen dichter bij de gegevens plaatsvinden, waardoor overhead wordt verminderd en het systeem stabieler wordt voor onverwachte veranderingen (geen fragiele scripts of DOM-aannames). De operators van Codec volgen een continue perceive–think–act-lus. De machinelayer streamt de omgeving (bijv. een live-app of robotfeed) naar de intelligentielaag via de geoptimaliseerde kanalen van de systeemlaag, waardoor de AI "ogen" krijgt op de huidige staat. Het VLA-model van de agent interpreteert vervolgens de visuals en instructies samen om een actie te bepalen, die de systeemlaag uitvoert via toetsenbord/muisgebeurtenissen of robotbesturing. Deze geïntegreerde lus betekent dat het zich aanpast aan live-evenementen, zelfs als de UI verschuift, je zult de stroom niet onderbreken. Om dit alles in een eenvoudigere analogie te plaatsen, denk aan de operators van Codec als een zelfvoorzienende werknemer die zich aanpast aan verrassingen op de werkvloer. De agent van Nuit is als een werknemer die moet pauzeren, de situatie aan een supervisor aan de telefoon moet beschrijven en op instructies moet wachten. Zonder te veel in een technische konijnenhol te duiken, zou dit je een hoog niveau idee moeten geven over waarom ik Codec heb gekozen als mijn primaire inzet op Operators. Ja, Nuit heeft steun van YC, een sterk team en S-tier github. Hoewel de architectuur van Codec is gebouwd met horizontale schaalbaarheid in gedachten, wat betekent dat je duizenden agents parallel kunt inzetten zonder gedeeld geheugen of uitvoeringscontext tussen agents. Het team van Codec is ook geen gemiddelde ontwikkelaars. Hun VLA-architectuur opent een veelvoud aan gebruikscases die niet mogelijk waren met eerdere agentmodellen vanwege het zien door pixels, niet door screenshots. Ik zou verder kunnen gaan, maar ik bewaar dat voor toekomstige berichten.
1,92K