Recent Openai, Goolge a ajuns la medalia de aur IMO cu noile lor modele experimentale. Dar echipa noastră a ajuns la același nivel cu doar o4-mini-high și sistemele noastre de agenți. Și acum îl deschidem. Mai ales am obținut îmbunătățiri nebunești cu benchmark-urile USAMO. Linia de bază a fost aproape 0, dar agentul nostru a obținut o medie de 90%. De asemenea, am putea dovedi teoretic lucrările recente arxiv care dau doar ideea cheie de cercetare.
84,33K