1/N Sunt încântat să vă împărtășesc că cel mai recent @OpenAI raționament experimental LLM a realizat o mare provocare de lungă durată în AI: performanța la nivel de medalie de aur la cea mai prestigioasă competiție de matematică din lume - Olimpiada Internațională de Matematică (IMO).
4/N În al doilea rând, trimiterile IMO sunt dovezi greu de verificat, de mai multe pagini. Progresul aici cere depășirea paradigmei RL a recompenselor clare și verificabile. Procedând astfel, am obținut un model care poate crea argumente complicate și etanșe la nivelul matematicienilor umani.
5/N Pe lângă rezultatul în sine, sunt încântat de abordarea noastră: atingem acest nivel de capacitate nu printr-o metodologie îngustă, specifică sarcinii, ci prin deschiderea de noi drumuri în învățarea prin întărire de uz general și scalarea calculului în timpul testelor.
8/N Apropo, lansăm GPT-5 în curând și suntem încântați să-l încercați. Dar ca să fie clar: IMO gold LLM este un model de cercetare experimentală. Nu intenționăm să lansăm nimic cu acest nivel de capacitate matematică timp de câteva luni.
9/N Totuși, acest lucru subliniază cât de repede a avansat AI în ultimii ani. În 2021, îndrumătorul meu de doctorat mi-@JacobSteinhardt pus să prognozez progresul matematicii AI până în iulie 2025. Am prezis 30% la benchmark-ul MATH (și am crezut că toți ceilalți sunt prea optimiști). În schimb, avem aur IMO.
11/N În cele din urmă, dorim să felicităm toți participanții la IMO 2025 pentru realizările lor! Suntem mândri să avem mulți participanți IMO din trecut la @OpenAI și recunoaștem că aceștia sunt unele dintre cele mai strălucite minți tinere ale viitorului.
131,55K