Vânzarea publică PUMP s-a încheiat, inițial am fost și eu o sumă mare în Bybit, doar 1/2 pe lanț și, în cele din urmă, doar lanțul a avut succes, din fericire nu a existat nicio acoperire în avans... Recent, au existat multe discuții în comunitatea AI despre VLA (Vision-Language-Action) În special, m-am dus să cercetez dacă există cineva care face proiecte legate de VLA în lanț și am văzut acest proiect CodecFlow@Codecopenflow și am cumpărat puțin. == Ce face CodecFlow == O scurtă introducere în VLA, o arhitectură model care permite AI nu doar să "vorbească", ci și să "facă". LLM-urile tradiționale (cum ar fi GPT) pot înțelege doar limbajul și pot oferi sugestii, dar nu pot face practică, nu pot face clic pe ecrane sau pot apuca obiecte. Modelul VLA înseamnă că integrează trei capabilități: 1. Viziune: înțelegeți imaginile, capturile de ecran, intrările camerei sau datele senzorului 2. Limbaj: Înțelegeți instrucțiunile de limbaj natural uman 3. Acțiune: Generați comenzi executabile, cum ar fi clicuri de mouse, intrare de la tastatură și controlul brațului robotic CodecFlow face VLA pe lanț și toate procesele pot fi, de asemenea, încărcate în lanț, care pot fi auditate, verificate și decontate. În termeni simpli, este infrastructura unui "bot AI". == De ce acord o atenție deosebită acestui articol? == Am aflat că dezvoltatorii lor sunt contribuitori principali la LeRobot, cel mai tare proiect open source din spațiul VLA! LeRobot este baza de top pentru construirea de modele VLA în lumea open source, inclusiv VLA-uri ușoare care pot rula pe laptopuri precum SmolVLA. Înseamnă că această echipă înțelege cu adevărat arhitectura VlA și robotul. Văd că și ei continuă să crească, iar prețul monedei crește constant, sunt foarte optimist cu privire la traiectoria VLA și, din tendința generală, VLA și roboții sunt într-adevăr viitorul pe piață. Giganții Web2 (Google, Meta, Tesla) sunt acum pe deplin dedicați antrenamentului VLA și bot; • Proiectele Web3 sunt rare în ceea ce privește aplicațiile VLA care pot îndeplini sarcini • VLA are oportunitatea de a juca un rol uriaș în scenarii precum DePIN, automatizare web și execuția agenților AI on-chain. CA:69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump Întotdeauna DYOR。
CodecFlow
CodecFlow26 iun. 2025
Ce este un operator $CODEC? Este locul în care modelele Vision-Language-Action fac în sfârșit AI utilă pentru munca reală. Un operator este un agent software autonom alimentat de modele VLA care îndeplinește sarcini printr-un ciclu continuu de percepție-rațiune-acțiune. LLM-urile pot gândi și vorbi strălucitor, dar nu pot arăta, face clic sau apuca nimic. Sunt motoare de raționament pur cu zero împământare în lumea fizică. VLA combină percepția vizuală, înțelegerea limbajului și ieșirea acțiunilor structurate într-o singură trecere înainte. În timp ce un LLM descrie ce ar trebui să se întâmple, un model VLA face de fapt acest lucru prin emiterea de coordonate, semnale de control și comenzi executabile. Fluxul de lucru al operatorului este: - Percepție: capturează capturi de ecran, fluxuri de cameră sau date ale senzorilor. - Raționament: procesează observațiile alături de instrucțiuni în limbaj natural folosind modelul VLA. - Acțiune: execută decizii prin interacțiuni cu interfața de utilizare sau control hardware, totul într-o buclă continuă. Exemple: LLM vs. operator alimentat de modelul VLA Programarea unei întâlniri LLM: Oferă o explicație detaliată a gestionării calendarului, subliniind pașii pentru programarea unei întâlniri. Operator cu model VLA: - Capturează desktopul utilizatorului. - Identifică aplicația de calendar (de exemplu, Outlook, Google Calendar). - Navighează la joi, creează o întâlnire la ora 14 și adaugă participanți. - Se adaptează automat la modificările interfeței cu utilizatorul. Robotică: sortarea obiectelor LLM: Generează instrucțiuni scrise precise pentru sortarea obiectelor, cum ar fi identificarea și organizarea componentelor roșii. Operator cu model VLA: - Observă spațiul de lucru în timp real. - Identifică componentele roșii printre obiectele mixte. - Planifică traiectorii fără coliziune pentru un braț robotic. - Execută operațiuni de preluare și plasare, ajustându-se dinamic la noi poziții și orientări. Modelele VLA reduc în sfârșit decalajul dintre AI care poate raționa despre lume și AI care o poate schimba de fapt. Acestea sunt cele care transformă automatizarea dintr-o aplicare fragilă a regulilor într-o rezolvare adaptivă a problemelor - lucrători inteligenți. "Scripturile tradiționale se întrerup atunci când mediul se schimbă, dar operatorii folosesc înțelegerea vizuală pentru a se adapta în timp real, gestionând excepțiile în loc să se prăbușească asupra lor."
10,71K