Performanță la nivel de medalie de aur la Olimpiada Internațională de Matematică din 2025 din cel mai recent LLM de raționament experimental. Model operat în limbaj natural (adică produce dovezi în limbaj natural) sub aceleași reguli ca și oamenii (de exemplu, 4,5 ore pe sesiune, fără instrumente). O piatră de hotar uimitoare!
Alexander Wei
Alexander Wei19 iul., 15:50
1/N Sunt încântat să vă împărtășesc că cel mai recent @OpenAI raționament experimental LLM a realizat o mare provocare de lungă durată în AI: performanța la nivel de medalie de aur la cea mai prestigioasă competiție de matematică din lume - Olimpiada Internațională de Matematică (IMO).
Ceea ce este cel mai remarcabil este că acest sistem folosește o abordare foarte generală, folosind învățarea prin întărire și scalarea calculului timpului de testare:
Alexander Wei
Alexander Wei19 iul., 15:50
5/N Pe lângă rezultatul în sine, sunt încântat de abordarea noastră: atingem acest nivel de capacitate nu printr-o metodologie îngustă, specifică sarcinii, ci prin deschiderea de noi drumuri în învățarea prin întărire de uz general și scalarea calculului în timpul testelor.
121,95K