Ver al modelo resolver estos problemas de IMO y alcanzar un rendimiento de nivel oro fue mágico. Algunos pensamientos 🧵
Alexander Wei
Alexander Wei19 jul, 15:50
1/N Estoy emocionado de compartir que nuestro último LLM experimental de @OpenAI ha logrado un desafío importante en IA: un rendimiento de nivel medalla de oro en la competencia de matemáticas más prestigiosa del mundo: la Olimpiada Internacional de Matemáticas (IMO).
El modelo resuelve estos problemas sin herramientas como lean o programación, solo utiliza lenguaje natural, y además solo tiene 4.5 horas. Vemos al modelo razonar a un nivel muy alto: probando diferentes estrategias, haciendo observaciones a partir de ejemplos y probando hipótesis.
Es una locura cómo hemos pasado del 12% en AIME (GPT 4o) → IMO oro en ~ 15 meses. Hemos avanzado mucho muy rápido. ¡No me sorprendería si el próximo año los modelos estuvieran derivando nuevos teoremas y contribuyendo a la investigación matemática original!
487,13K