Noam Brown de openAI confirmó 2 puntos clave: 1) el modelo que alcanzó un rendimiento de nivel oro en IMO es de propósito general — no está ajustado para matemáticas, y lo logró sin usar herramientas. 2) openAI desarrolló nuevas técnicas que mejoran significativamente los LLMs. ¿Podría ser un nuevo avance en RL o una mejora algorítmica?
27,9K