Performance de niveau médaille d'or lors de l'Olympiade internationale de mathématiques 2025 grâce à notre dernier LLM de raisonnement expérimental. Le modèle a fonctionné en langage naturel (c'est-à-dire qu'il produit des preuves en langage naturel) selon les mêmes règles que les humains (par exemple, 4,5 heures par session, pas d'outils). Incroyable étape!
Alexander Wei
Alexander Wei19 juil., 15:50
1/N Je suis ravi de partager que notre dernier LLM expérimental de raisonnement @OpenAI a atteint un défi de longue date en IA : une performance de niveau médaille d'or lors de la compétition mathématique la plus prestigieuse au monde - l'Olympiade Internationale de Mathématiques (IMO).
Ce qui est le plus remarquable, c'est que ce système utilise une approche très générale, utilisant l'apprentissage par renforcement et l'augmentation des capacités de calcul en temps de test :
Alexander Wei
Alexander Wei19 juil., 15:50
5/N En plus du résultat lui-même, je suis enthousiaste à propos de notre approche : nous atteignons ce niveau de capacité non pas par une méthodologie étroite et spécifique à une tâche, mais en ouvrant de nouvelles voies dans l'apprentissage par renforcement à usage général et l'échelle de calcul au moment du test.
119,65K