Ostatnio OpenAI i Google osiągnęli IMO Złoty Medal z ich nowymi modelami eksperymentalnymi. Jednak nasz zespół osiągnął ten sam poziom tylko dzięki o4-mini-high i naszym systemom agentów. A teraz udostępniamy to jako open source. Szczególnie uzyskaliśmy niesamowite poprawy w benchmarkach USAMO. Linia bazowa wynosiła prawie 0, ale nasz agent uzyskał średnio 90%. Również mogliśmy teoretycznie udowodnić niedawne prace z arxiv, po prostu podając kluczowy pomysł badawczy.
84,33K