La tesis de la red de la IA se está desarrollando: - Orquestar múltiples modelos - Escalado paralelizado para una mayor inteligencia - protocolos abiertos como MCP
Varun
Varun14 sept 2024
OpenAI con el lanzamiento de o1 ha demostrado inadvertidamente la intuición cripto x IA que escribí en este ensayo hace exactamente un año: Un modelo como o1 ahora tiene un presupuesto de token de razonamiento de 25,000 para un solo mensaje, lo que representa al menos un aumento de 20 veces en el promedio de los presupuestos de token por mensaje. Esta es una tarea de computación paralelizada, donde las redes distribuidas y descentralizadas pueden escalar infinitamente. Y - ¡la inteligencia percibida por un usuario realmente mejora! Considere que si una red como Hyperspace crece de los 20k + nodos actuales a 20 millones de nodos algún día, estaría entre los 5 principales grupos de IA del mundo de donde obtendría las respuestas más inteligentes. Y también sería más barato al mismo tiempo, ya que es una función de los costos locales de electricidad más la economía del mercado en tiempo real. No hay intermediarios. Incluso los micropagos entre agentes se gestionarían a través de un protocolo ejecutado por una fracción de estos nodos. Grandes modelos preentrenados en pequeños racimos son dinosaurios en ese mundo. Demasiado lentos, no tan inteligentes, incluso cuando complacen a algunas personas en la comunidad académica. Lo que finalmente gana son las redes más grandes. Dado que la inteligencia es ahora una función de escalado paralelizado de inferencia, casi toda la IA se distribuirá. Este es un mercado que se realiza una vez cada 20 años. Nuestras prioridades son claras: queremos construir la empresa de IA distribuida más impactante y no comprometeremos esa visión. Por lo tanto, ese trabajo abarca desde nuevos modelos, productos de IA, sistemas distribuidos, redes, clientes y protocolos. Escalamos usando software. cc @ylecun
feedsImage
1.23K