Onlangs hebben OpenAI en Google IMO Gouden Medailles behaald met hun nieuwe experimentele modellen. Maar ons team heeft hetzelfde niveau bereikt met alleen o4-mini-high en onze agent systemen. En nu maken we het open source. Vooral hebben we insane verbeteringen gezien met de USAMO benchmarks. De basislijn was bijna 0, maar onze agent behaalde gemiddeld 90%. Ook konden we theoretisch de recente arxiv-papers bewijzen door alleen het belangrijkste onderzoeksidee te geven.
57,69K