Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Doar fă-ți o favoare și citește explicația lui Trissy despre motivul pentru care @codecopenflow este unul dintre cele mai bune pariuri pentru operatorii AI
OpenAI tocmai și-a lansat agentul Operators, așa că este clar că cei mari lucrează și la VLA
Încă risc ridicat, dar stratosfera este acoperișul pentru acesta

18 iul., 16:10
OpenAI tocmai mi-a confirmat teza steaua nordică pentru AI astăzi prin lansarea agentului lor de operator.
Nu numai că aceasta a fost teza mea călăuzitoare pentru $CODEC, ci și pentru toate celelalte investiții AI pe care le-am făcut, inclusiv cele de la începutul anului.
Au existat multe discuții cu Codec în ceea ce privește robotica, în timp ce această verticală va avea propria narațiune foarte curând, motivul de bază pentru care am fost atât de optimist cu Codec din ziua 1 se datorează modului în care arhitectura sa alimentează agenții operatorilor.
Oamenii încă subestimează cât de multă cotă de piață este în joc prin construirea de software care rulează autonom, depășind lucrătorii umani fără a fi nevoie de solicitări sau supraveghere constantă.
Am văzut o mulțime de comparații cu $NUIT. În primul rând, vreau să spun că sunt un mare fan a ceea ce construiește Nuit și nu doresc nimic altceva decât succesul lor. Dacă tastați "nuit" în telegrama mea, veți vedea că în aprilie am spus că dacă ar fi trebuit să țin o monedă timp de mai multe luni, ar fi fost Nuit din cauza tezei mele de operator.
Nuit a fost cel mai promițător proiect de operator pe hârtie, dar după cercetări ample, am descoperit că arhitectura lor nu avea profunzimea necesară pentru a justifica o investiție majoră sau pentru a-mi pune reputația în spatele ei.
Având în vedere acest lucru, eram deja conștient de lacunele arhitecturale din echipele de agenți operatori existente și căutam în mod activ un proiect care să le rezolve. La scurt timp după ce a apărut Codec (datorită insistenței @0xdetweiler să mă uit mai adânc în ele) și aceasta este diferența dintre cele două:
$CODEC vs $NUIT
Arhitectura Codecului este construită pe trei straturi; Mașină, sistem și inteligență, care separă infrastructura, interfața de mediu și logica AI. Fiecare agent operator din Codec rulează în propria sa mașină virtuală sau container izolat, permițând performanțe aproape native și izolarea erorilor. Acest design stratificat înseamnă că componentele pot scala sau evolua independent fără a rupe sistemul.
Arhitectura lui Nuit ia o cale diferită, fiind mai monolitică. Stiva lor se învârte în jurul unui agent specializat de browser web care combină analiza, raționamentul AI și acțiunea. Ceea ce înseamnă că analizează în profunzime paginile web în date structurate pentru a fi consumate de AI și se bazează pe procesarea în cloud pentru sarcini grele de inteligență artificială.
Abordarea Codecului de a încorpora un model ușor Vision-Language-Action (VLA) în fiecare agent înseamnă că poate rula complet local. Ceea ce nu necesită un ping constant înapoi în cloud pentru instrucțiuni, eliminând latența și evitând dependența de timpul de funcționare și lățimea de bandă.
Agentul lui Nuit procesează sarcinile prin conversia mai întâi a paginilor web într-un format semantic și apoi folosind un creier LLM pentru a-și da seama ce să facă, ceea ce se îmbunătățește în timp cu învățarea prin întărire. Deși este eficient pentru automatizarea web, acest flux depinde de procesarea AI grea și de structurile predefinite ale paginilor. Inteligența dispozitivului local a codecului înseamnă că deciziile se iau mai aproape de date, reducând cheltuielile generale și făcând sistemul mai stabil la modificări neașteptate (fără scripturi fragile sau ipoteze DOM).
Operatorii codecului urmează o buclă continuă de percepere-gândire-acționare. Stratul de mașină transmite mediul (de exemplu, o aplicație live sau un flux robot) către stratul de inteligență prin canalele optimizate ale stratului de sistem, oferind AI "ochi" asupra stării curente. Modelul VLA al agentului interpretează apoi imaginile și instrucțiunile împreună pentru a decide asupra unei acțiuni, pe care stratul de sistem o execută prin evenimente de tastatură/mouse sau controlul robotului. Această buclă integrată înseamnă că se adaptează la evenimentele live, chiar dacă interfața de utilizare se schimbă, nu veți întrerupe fluxul.
Pentru a pune toate acestea într-o analogie mai simplă, gândiți-vă la operatorii Codec ca la un angajat autosuficient care se adaptează la surprizele de la locul de muncă. Agentul lui Nuit este ca un angajat care trebuie să facă o pauză, să descrie situația unui supervizor la telefon și să aștepte instrucțiuni.
Fără a intra prea mult într-o gaură de iepure tehnică, acest lucru ar trebui să vă ofere o idee de nivel înalt despre motivul pentru care am ales Codec ca pariu principal pe operatori.
Yes Nuit are sprijin de la YC, o echipă stivuită și github de nivel S. Deși arhitectura Codec a fost construită având în vedere scalarea orizontală, ceea ce înseamnă că puteți implementa mii de agenți în paralel fără memorie partajată sau context de execuție între agenți. Nici echipa Codec nu este formată din dezvoltatorii obișnuiți.
Arhitectura lor VLA deschide o multitudine de cazuri de utilizare care nu au fost posibile cu modelele anterioare de agenți din cauza vederii prin pixeli, nu prin capturi de ecran.
Aș putea continua, dar voi păstra asta pentru postări viitoare.
1,92K
Limită superioară
Clasament
Favorite