¡Rendimiento de nivel medalla de oro en la Olimpiada Internacional de Matemáticas 2025 de nuestro último LLM de razonamiento experimental! El modelo operó en lenguaje natural (es decir, produce pruebas en lenguaje natural) bajo las mismas reglas que los humanos (por ejemplo, 4.5 horas por sesión, sin herramientas). ¡Hito increíble!
Alexander Wei
Alexander Wei19 jul, 15:50
1/N Estoy emocionado de compartir que nuestro último LLM experimental de @OpenAI ha logrado un desafío importante en IA: un rendimiento de nivel medalla de oro en la competencia de matemáticas más prestigiosa del mundo: la Olimpiada Internacional de Matemáticas (IMO).
Lo más notable es que este sistema utiliza un enfoque muy general, utilizando aprendizaje por refuerzo y escalado del tiempo de cómputo de prueba:
Alexander Wei
Alexander Wei19 jul, 15:50
5/N Además del resultado en sí, estoy emocionado por nuestro enfoque: alcanzamos este nivel de capacidad no a través de una metodología específica y estrecha, sino rompiendo nuevos caminos en el aprendizaje por refuerzo de propósito general y la escalabilidad del cómputo en el momento de la prueba.
119,65K