Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Imagine o que aconteceria se, por causa de algum post que você escreveu há anos no reddit, stackexchange, no seu próprio blog, etc., você pudesse receber uma parte da receita gerada pelo o3 ou sonnet ou provedores de serviços hospedados de LLMs de código aberto.
Se os dados gerados por humanos na internet são o combustível fóssil para alcançar a AGI, os humanos precisam ser capazes de extrair valor capturado em proporção à sua contribuição.
Em vez disso, o que acontece agora é
> as grandes empresas de tecnologia pagam uma quantia fixa para construir conjuntos de dados e anexar uma licença
> constroem um modelo base
> anexam uma API para cobrar $/mês ou $ por N tokens
> geram receita, levantam $10s ou $100s B em avaliações privadas, os preços das ações sobem
Os humanos OG cujos dados foram críticos não recebem nada dessas enormes capturas de valor.
Os céticos podem dizer "oh, agora usamos dados sintéticos para treinamento porque achamos a IA superior aos humanos". Mas, cara, você está apenas usando modelos maiores feitos anteriormente a partir de dados humanos para gerar dados sintéticos para preparar modelos menores, mas mais inteligentes. Isso apenas significa que o modelo menor não existiria sem o modelo anterior e, por genealogia, os dados humanos OG. Novamente, os humanos OG merecem ver uma parte do valor capturado em suas carteiras.
Com o RLHF se tornando cada vez mais crítico para o pós-treinamento, os usuários estão sendo solicitados a pressionar o botão de curtir ou não nas interfaces de chatbot. Essa preferência está sendo usada para melhorar ainda mais o modelo, que é então utilizado para cobrar mais $/mês ou $ por N tokens para a próxima edição do LLM. No entanto, você, sim, você, usuários humanos, não consegue ver nenhum desses valores sendo repassados para sua carteira.
É óbvio que ter acesso a GPUs avançadas e ao combustível fóssil dos dados humanos tem sido crítico para construir as ofertas de LLM mais competitivas. No entanto, apenas os acionistas da tsmc, nvidia, google, etc., e os investidores de risco, investidores anjo da openai, anthropic, etc., estão capturando todo o valor. Os humanos normais, cuja pegada digital foi utilizada, acabam recebendo migalhas.
Independentemente da data que os especialistas em IA ou filósofos modernos tenham estabelecido para alcançar a AGI, o caminho para a AGI está sendo pavimentado com o roubo dos direitos de propriedade dos humanos sobre seus dados ou ações digitais.
Não estou dizendo que tenho a solução, mas aqui está o maior desafio: como podemos construir um mercado de dados sem risco de contraparte que seja capaz de medir continuamente a contribuição de cada unidade de ação digital de um humano em relação à captura de valor de qualquer modelo comercial e compartilhar a royalties de volta com o humano? Imagine isso acontecendo, teremos um pipeline onde qualquer uma dessas gigantes pode usar dados humanos para criar modelos cada vez melhores, enquanto também garante que o humano comum possa colher o pagamento devido por suas ações digitais. Que mundo maravilhoso seria esse! Alocação justa.
Apenas uma reflexão tardia de sexta-feira!
246
Top
Classificação
Favoritos