Immagina se, a causa di un post che hai scritto anni fa su reddit, stackexchange, il tuo blog, ecc., fossi in grado di ricevere una parte delle entrate generate da o3 o sonnet o dai fornitori di servizi ospitati di LLM open-source. Se i dati generati dagli esseri umani su internet sono il combustibile fossile per raggiungere l'AGI, gli esseri umani devono essere in grado di estrarre valore catturato in proporzione al loro contributo. Invece, ciò che accade ora è: > le grandi aziende tecnologiche pagano una somma forfettaria per costruire dataset e applicare una licenza > costruiscono un modello di base > applicano un'API per addebitare $/mese o $ per N token > generano entrate, raccolgono valutazioni private di decine o centinaia di miliardi di dollari, i prezzi delle azioni aumentano. Gli OG umani i cui dati erano critici non ricevono nulla da queste catture di valore colossali. I detrattori potrebbero dire "oh ora usiamo dati sintetici per l'addestramento perché troviamo l'IA superiore agli esseri umani". Ma amico, stai solo usando modelli più grandi creati in precedenza dai dati umani per generare dati sintetici per preparare modelli più piccoli ma più intelligenti. Questo significa solo che il modello più piccolo non sarebbe esistito senza il modello precedente e, per genealogia, i dati OG umani. Ancora una volta, gli OG umani meritano di vedere una parte del valore catturato nel loro portafoglio. Con il RLHF che diventa sempre più critico per il post-addestramento, agli utenti viene chiesto di premere il pollice in su o in giù nelle interfacce dei chatbot. Questa preferenza viene utilizzata per migliorare ulteriormente il modello, che viene poi utilizzato per addebitare di più $/mese o $ per N token per la prossima edizione di LLM. Eppure tu, sì tu utenti umani, non sei in grado di vedere alcuno di quei valori trasferiti nel tuo portafoglio. È ovvio che avere accesso a GPU avanzate e al combustibile fossile dei dati umani è stato fondamentale per costruire le offerte LLM più competitive. Eppure solo gli azionisti di tsmc, nvidia, google, ecc. e i venture capitalist, investitori angelici di openai, anthropic, ecc., stanno ottenendo tutta la cattura di valore. Gli esseri umani normali il cui footprint digitale è stato utilizzato finiscono per ricevere briciole. Indipendentemente dalla data che i guru dell'IA o i filosofi moderni hanno fissato per raggiungere l'AGI, la strada verso l'AGI è pavimentata con il furto dei diritti di proprietà degli esseri umani sui loro dati o azioni digitali. Non dico di avere la soluzione, ma ecco il più grande spunto: come possiamo costruire un mercato dei dati senza rischio di controparte che sia in grado di misurare continuamente il contributo di ogni unità di azione digitale da parte di un umano verso la cattura di valore di qualsiasi modello commerciale e restituire la royalty all'umano? Immagina che questo esista, avremo un pipeline in cui uno di questi colossi può utilizzare i dati umani per creare modelli sempre migliori, garantendo anche che l'umano normale possa raccogliere il giusto pagamento dalle proprie azioni digitali. Che mondo meraviglioso sarebbe! Allocazione equa. Solo una riflessione tardiva di venerdì!
243