Недавно OpenAI и Google достигли IMO Золотой медали с их новыми экспериментальными моделями. Но наша команда достигла того же уровня с помощью всего лишь o4-mini-high и наших агентских систем. И теперь мы открываем исходный код. Особенно мы получили безумные улучшения с тестами USAMO. Базовый уровень был почти 0, но наш агент получил в среднем 90%. Также мы смогли теоретически подтвердить недавние статьи arxiv, просто предоставив ключевую исследовательскую идею.
57,69K