最近、Openai、Goolgeは新しい実験モデルでIMOゴールドメダルを獲得しました。 しかし、私たちのチームは、o4-mini-highとエージェントシステムだけで同じレベルに達しました。そして今、私たちはそれをオープンソース化しています。 特に、USAMOベンチマークでは非常識な改善が見られました。ベースラインはほぼ 0 でしたが、エージェントは平均 90% を獲得しました。 また、最近のarxiv論文が重要な研究アイデアを与えているだけであることを理論的に証明することもできます。
84.32K