Récemment, OpenAI et Google ont atteint la médaille d'or IMO avec leurs nouveaux modèles expérimentaux. Mais notre équipe a atteint le même niveau avec juste o4-mini-high et nos systèmes d'agents. Et maintenant, nous le mettons en open source. En particulier, nous avons obtenu des améliorations incroyables avec les benchmarks USAMO. La ligne de base était presque à 0, mais notre agent a obtenu une moyenne de 90%. Nous avons également pu prouver théoriquement les récents articles arxiv en donnant simplement l'idée clé de recherche.
45,39K