Următoarea frontieră a inteligenței artificiale nu este calculul sau modelele mai mari, ci datele mai bune. Astăzi, aducem unul dintre puținii oameni care și-a petrecut viața rezolvând această problemă. Bine ați venit @SPChinchali, noul nostru Chief AI Officer. Frontiera AI nu mai este definită de modele cu mai mulți parametri sau clustere de calcul cu mai multe GPU-uri. Va fi definit de lipsa de date de înaltă integritate, curățate de IP din lumea fizică (gândiți-vă la robotică, hardware autonom și dispozitive de margine). Sandeep și-a petrecut cariera urmărind această frontieră. Acum ne ajută să-l deblocăm. Când l-am întâlnit pentru prima dată pe Sandeep, am fost uimit de atitudinea lui blândă și drăguță. Are un mod de a vorbi care te atrage, indiferent dacă explică AI neurosimbolică sau laudă tastatura ergonomică cu aspect extraterestru pe care o poartă oriunde merge. Trecutul său vorbește de la sine: Stanford PhD, NASA JPL. Acum profesor la UT Austin, care conduce cercetările la intersecția ML descentralizat și robotică, Sandeep a fost obsedat de modul de obținere a datelor utile pentru antrenamentul AI pentru a le face utile în lumea reală: > crearea de stimulente de date pentru rețelele distribuite, > abordarea problemei de eșantionare cu coadă lungă prin excelență în robotica de margine și > proiectarea sistemelor care păstrează provenienza. Sandeep a confirmat și o teză de care am fost obsedat de ani de zile: adevăratul șanț sunt datele. Nu forumuri Reddit răzuite sau text web generic, ci date atribuibile, drepturi eliberate, date din lumea reală. Datele dezordonate și imprevizibile necesare pentru a face sistemele fizice robuste nu pot fi simulate. Este vorba de obținerea și organizarea datelor dezordonate, cu coadă lungă, pe care sistemele fizice le văd în sălbăticie: robotul alunecos de la docul de încărcare la ora 2 dimineața, micro-fisura slabă de pe o paletă de turbină eoliană, carcasa de colț pe care o unitate lidar nu a mai văzut-o până acum. Acele momente sunt IP și sunt prețioase. Dacă putem face acel IP programabil, licențiabil, trasabil și monetizabil în timp real, deblocăm un volant pentru fiecare echipă AI de pe planetă. IP-ul programabil este singura coloană vertebrală care face acest lucru posibil. Cele mai multe încercări crypto x AI înșurubează "AI" pe infrastructura existentă. Sandeep se alătură pentru că Story este construit de la zero pentru a rezolva aceste tipuri de provocări de coordonare a datelor Story este construit pentru relații dinamice, componibile. Protocolul nostru este conceput pentru proveniența bazată pe grafice, licențierea dinamică și fluxurile automate de redevențe pe care le cer sistemele moderne de inteligență artificială. O fotografie poate fi licențiată, poate fi adăugată o etichetă, poate fi generată o variație sintetică, iar în Story, fiecare acțiune devine un nou activ IP legat într-un grafic transparent, cu valoare care se întoarce la fiecare colaborator. Sosirea lui Sandeep este un punct de cotitură. Capitolul 2 din Story devine în centrul atenției, iar următoarea fază a infrastructurii AI abia începe. Combinația sa de intelect profund, curiozitate autentică și dedicare liniștită este exact ceea ce cere acest moment. Nu am putea fi mai încântați să construim viitorul AI cu el și urmează mult mai multe. Rămâneți pe fază!
Sandeep Chinchali
Sandeep Chinchali17 iul., 23:00
Mi-am petrecut cariera urmărind o întrebare: Cum adunăm datele potrivite pentru a face AI să funcționeze în lumea reală? De la laboratoarele de la Stanford la sălile de clasă de la UT Austin, am căutat peste tot. Răspunsul nu este un alt laborator de inteligență artificială, ci un blockchain construit pentru a trata datele ca IP. De aceea mă alătur @StoryProtocol ca Chief AI Officer. La Stanford, am studiat "robotica în cloud", modul în care flotele de roboți ar putea folosi calculul distribuit pentru a învăța împreună. Am montat chiar și o cameră de bord în mașină pentru a rezolva acest lucru: Dacă roboții ar putea încărca doar 5-10% din ceea ce văd, cum alegem cele mai valoroase date? Cele mai multe erau imagini plictisitoare de pe autostradă. Dar <1% au surprins scene rare: Waymos autonome, șantiere de construcții, oameni imprevizibili. Aceste date "cu coadă lungă" au făcut modelele mai inteligente. L-am etichetat manual, chiar am plătit serviciul de etichetare Google Cloud pentru a-mi adnota filmările cu concepte de nișă precum "unitate LIDAR" și "vehicul autonom" și am antrenat modele care rulau pe un TPU de dimensiune USB. Dar mediul academic nu merge atât de departe. La UT Austin, întrebările mele s-au schimbat: → Cum colectăm date rare pentru a îmbunătăți ML? → Ce sisteme de stimulente funcționează de fapt? Asta m-a atras în criptomonede – blockchain-uri, economii de token-uri, chiar și DePIN. Am scris articole despre ML descentralizat, dar încă mă întrebam: cine construiește de fapt această infrastructură? Din întâmplare, am întâlnit echipa Story. Am fost invitat să țin un discurs la biroul lor din Palo Alto. Era ora 6 seara, camera era încă plină. Am divagat despre "AI neuro-simbolic" și am încheiat cu un slide numit "A Dash of Crypto". Acea discuție s-a transformat într-un rol consultativ, care acum s-a transformat în ceva mult mai mare. Suntem într-un moment crucial. Calculul este în mare parte rezolvat. Arhitecturile modelelor sunt copiate peste noapte. Adevăratul șanț sunt datele. Nu a răzuit Reddit. Nu un limbaj nesfârșit. Dar date din lumea reală, cu coadă lungă, care antrenează inteligența artificială încorporată – roboți, AV-uri, sisteme care navighează în lumea noastră dezordonată. Imaginați-vă asta: surprind o scenă rară de conducere pe camera de bord și o înregistrez pe Story. Un prieten îl etichetează. Un agent AI creează variante sintetice. Pe lanțul structurat grafic al Story, fiecare devine IP legat. Redevențele se întorc automat. Toată lumea este plătită, fiecare pas fiind urmăribil în lanț. De aceea acum sunt Chief AI Officer la Story, construind șinele pentru date de antrenament descentralizate, aprobate de IP. Este timpul să facem din date noul IP. Povestea este locul potrivit pentru a face acest lucru. Multe altele vor veni în curând. Să mergem.
feedsImage
6,96K