"Ils ont récemment développé de nouvelles techniques qui fonctionnent beaucoup mieux sur des problèmes difficiles à vérifier, ont étendu le TTC à plusieurs heures et ont amélioré l'efficacité de la réflexion." h/t à @Hangsiin pour avoir mis en avant ce bijou.
Noam Brown
Noam Brown19 juil., 15:52
Aujourd'hui, nous chez @OpenAI avons atteint un jalon que beaucoup considéraient comme étant à des années : une performance de niveau médaille d'or au 2025 IMO avec un LLM de raisonnement général—dans les mêmes limites de temps que les humains, sans outils. Aussi remarquable que cela puisse paraître, c'est encore plus significatif que le titre 🧵
3,16K