Kürzlich haben OpenAI und Google mit ihren neuen experimentellen Modellen IMO-Goldmedaillen erreicht. Aber unser Team hat dasselbe Niveau mit nur o4-mini-high und unseren Agentensystemen erreicht. Und jetzt machen wir es Open Source. Insbesondere haben wir wahnsinnige Verbesserungen bei den USAMO-Benchmarks erzielt. Die Basislinie lag fast bei 0, aber unser Agent hat im Durchschnitt 90 % erreicht. Außerdem konnten wir theoretisch die aktuellen arxiv-Papiere beweisen, indem wir die Schlüsselideen der Forschung gegeben haben.
84,33K