Je pensais que l'humanité était en sécurité il y a seulement 2 jours, ça se compte littéralement en jours… Un peu de contexte : Ce n'est pas la première fois que l'IA remporte une médaille à l'Olympiade Internationale de Mathématiques (IMO). L'année dernière, AlphaProof de Google a remporté l'argent - mais ce modèle a été spécifiquement entraîné pour les mathématiques. Cette fois, OpenAI a utilisé un modèle à usage général (probablement un prototype interne de GPT-5 ?), et il a remporté l'or. C'est un énorme bond en avant en termes de signification. Pour mettre cela en perspective : résoudre un problème de niveau IMO prend généralement aux concurrents humains d'élite environ 100 minutes. Il y a seulement 2 ans, les meilleurs modèles d'IA avaient encore du mal avec des problèmes de mots de niveau élémentaire (GSM8k), qui prennent environ 10 secondes aux humains pour être résolus. Comme l'a partagé Dan Roberts d'OpenAI lors de l'AI Ascent 2025 de Sequoia, la durée des tâches que l'IA peut gérer double tous les 7 mois. D'ici fin 2025, GPT-5 pourrait très bien fonctionner à des niveaux de tâches humaines d'une heure. Une mise en garde : l'IMO de cette année aurait apparemment eu un défaut d'équilibre de difficulté - les problèmes 1 à 5 étaient relativement faciles, tandis que le problème 6 était exceptionnellement difficile. En conséquence, de nombreux scores se sont regroupés entre 28 et 35 (chaque problème vaut 7 points). L'IA a obtenu un score de 35 - juste assez pour l'or. Un peu de chance, mais la trajectoire est indéniable. Enfin, les compétitions de mathématiques seront sans aucun doute une course entre les Chinois en Chine, les Chinois aux États-Unis et les modèles d'IA (construits par des Chinois aux États-Unis et en Chine).
Alexander Wei
Alexander Wei19 juil., 15:50
1/N Je suis ravi de partager que notre dernier LLM expérimental de raisonnement @OpenAI a atteint un défi de longue date en IA : une performance de niveau médaille d'or lors de la compétition mathématique la plus prestigieuse au monde - l'Olympiade Internationale de Mathématiques (IMO).
5,44K