Imaginați-vă ce ar fi dacă, din cauza unei postări pe care ați scris-o cu ani în urmă pe reddit, stackexchange, propriul blog etc., ați putea lua o parte din veniturile obținute de o3 sau sonnet sau furnizorii de servicii găzduite de LLM-uri open-source. Dacă datele generate de om în internet sunt combustibilul fosil pentru a ajunge la AGI, oamenii trebuie să fie capabili să extragă valoarea capturată proporțional cu contribuția lor. În schimb, ceea ce se întâmplă acum este > mari companii de tehnologie plătesc o sumă forfetară pentru a construi seturi de date și a obține o licență > construiți un model de fundație > un API pentru a percepe $/lună sau $ per N jetoane > face venituri, strânge evaluări private de 10 sau 100 de dolari, prețurile acțiunilor cresc OG-urile umane ale căror date au fost critice nu obțin nimic din aceste capturi de valori uriașe. Cei care se opun ar putea spune "oh, acum folosim date sintetice pentru antrenament, deoarece considerăm că AI este superioară oamenilor". Dar frate, folosești doar modele mai mari făcute anterior din date umane pentru a face date sintetice pentru a pregăti modele mai mici, dar mai inteligente. Asta înseamnă doar că modelul mai mic nu ar fi existat fără modelul anterior și, prin geneologie, datele umane OG. Din nou, OG-urile umane merită să vadă o parte din valoare capturată în portofelul lor. Având în vedere că RLHF devine din ce în ce mai critic pentru post-instruire, utilizatorii sunt rugați să apese degetul mare în sus sau în jos în interfețele chatbot. Această preferință este folosită pentru a îmbunătăți și mai mult modelul, care este apoi folosit pentru a percepe mai mulți $/lună sau $ per N jetoane pentru următoarea ediție a LLM. Cu toate acestea, da, utilizatorii umani, nu puteți vedea niciuna dintre aceste valori transmise în portofel. Este evident că accesul la GPU-uri avansate și combustibili fosili de date umane a fost esențial pentru construirea celor mai competitive oferte LLM. Cu toate acestea, doar acționarii tsmc, nvidia, google etc. și VC-urile, investitorii providențiali ai openai, anthropic etc., obțin toată captura de valoare. Oamenii normie a căror amprentă digitală a fost folosită ajung să primească alune. Indiferent de data pe care experții în IA sau filozofii moderni au stabilit-o pentru a realiza AGI, drumul către AGI este pavat cu furtul drepturilor de proprietate ale oamenilor asupra datelor sau acțiunilor lor digitale. Nu spun că am soluția, dar iată cea mai mare solicitare: cum construim o piață de date fără un risc de contraparte care este capabilă să măsoare continuu contribuția fiecărei unități de acțiune digitală a unui om la capturarea valorii oricărui model comercial și să împartă redevența înapoi omului? Imaginați-vă că acest lucru este acolo, vom avea o conductă în care oricare dintre acești giganți poate folosi datele umane pentru a crea modele din ce în ce mai bune, asigurându-se în același timp că oamenii normali pot recolta plata cuvenită din acțiunile lor digitale. Ce lume minunată va fi! Alocare echitabilă. Doar o reflecție de vineri târziu!
255