A OpenAI, com o lançamento do o1, provou inadvertidamente a intuição de cripto x IA que escrevi neste ensaio exatamente um ano atrás: Um modelo como o o1 agora tem um orçamento de tokens de raciocínio de 25.000 para um único prompt - representando pelo menos um aumento de 20x no orçamento médio de tokens por prompt. Esta é uma tarefa de computação paralelizada, onde redes distribuídas e descentralizadas podem escalar infinitamente. E - a inteligência percebida por um usuário realmente melhora! Considere se uma rede como a Hyperspace crescer dos 20k+ nós de hoje para 20 milhões de nós um dia, ela estaria entre os 5 maiores clusters de IA do mundo, onde você obteria as respostas mais inteligentes. E também seria mais barata ao mesmo tempo, pois é uma função dos custos locais de eletricidade mais a economia de mercado em tempo real. Não há intermediários. Mesmo micropagamentos entre agentes seriam geridos através de um protocolo executado por uma fração desses nós. Grandes modelos pré-treinados em pequenos clusters são dinossauros nesse mundo. Muito lentos, não tão inteligentes, mesmo que agradem algumas pessoas na comunidade acadêmica. O que eventualmente vence são as maiores redes. Como a inteligência agora é uma função da escalabilidade paralelizada da inferência, quase toda a IA vai ser distribuída. Este é um mercado que ocorre uma vez a cada 20 anos. Nossas prioridades são claras: queremos construir a empreitada de IA distribuída mais impactante e não vamos comprometer essa visão. Esse trabalho abrange, portanto, novos modelos, produtos de IA, sistemas distribuídos, redes, clientes e protocolos. Nós escalamos usando software. cc @ylecun
feedsImage
3,55K