Prestasjoner på gullmedaljenivå på den internasjonale matematikkolympiaden 2025 fra vår siste eksperimentelle resonnement LLM. Modellen opererte i naturlig språk (dvs. sender ut bevis på naturlig språk) under de samme reglene som mennesker (f.eks. 4,5 timer per økt, ingen verktøy). Fantastisk milepæl!
Alexander Wei
Alexander Wei19. juli, 15:50
1/N Jeg er glad for å dele at vår siste @OpenAI eksperimentelle resonnement LLM har oppnådd en langvarig stor utfordring innen AI: gullmedaljenivå på verdens mest prestisjefylte matematikkkonkurranse – International Math Olympiad (IMO).
Det som er mest bemerkelsesverdig er at dette systemet bruker en veldig generell tilnærming, ved å bruke forsterkende læring og skalering av testtidsberegning:
Alexander Wei
Alexander Wei19. juli, 15:50
5/N I tillegg til selve resultatet, er jeg begeistret for tilnærmingen vår: Vi når dette kapasitetsnivået ikke via smal, oppgavespesifikk metodikk, men ved å bryte ny innen generell forsterkningslæring og beregningsskalering på testtid.
107,51K