1 / N Estou animado para compartilhar que nosso mais recente LLM de raciocínio experimental @OpenAI alcançou um grande desafio de longa data em IA: desempenho em nível de medalha de ouro na competição de matemática mais prestigiada do mundo - a Olimpíada Internacional de Matemática (IMO).
2/N Avaliamos nossos modelos sobre os problemas da IMO de 2025 sob as mesmas regras que os competidores humanos: duas sessões de exame de 4,5 horas, sem ferramentas ou internet, lendo as declarações oficiais do problema e escrevendo provas de linguagem natural.
4 / N Em segundo lugar, as submissões da IMO são provas difíceis de verificar, com várias páginas. O progresso aqui exige ir além do paradigma RL de recompensas claras e verificáveis. Ao fazer isso, obtivemos um modelo que pode criar argumentos intrincados e estanques no nível dos matemáticos humanos.
5/N Além do resultado em si, estou animado com nossa abordagem: alcançamos esse nível de capacidade não por meio de uma metodologia estreita e específica da tarefa, mas abrindo novos caminhos no aprendizado por reforço de uso geral e no dimensionamento de computação em tempo de teste.
6/N Em nossa avaliação, o modelo resolveu 5 dos 6 problemas da IMO de 2025. Para cada problema, três ex-medalhistas da IMO classificaram independentemente a prova enviada pelo modelo, com pontuações finalizadas após consenso unânime. O modelo ganhou 35/42 pontos no total, o suficiente para o ouro! 🥇
8/N A propósito, estamos lançando o GPT-5 em breve e estamos ansiosos para que você o experimente. Mas só para ficar claro: o IMO gold LLM é um modelo de pesquisa experimental. Não planejamos lançar nada com esse nível de capacidade matemática por vários meses.
9/N Ainda assim, isso ressalta a rapidez com que a IA avançou nos últimos anos. Em 2021, meu orientador de doutorado @JacobSteinhardt me fez prever o progresso da matemática da IA até julho de 2025. Eu previ 30% no benchmark MATH (e pensei que todos os outros estavam muito otimistas). Em vez disso, temos ouro IMO.
11/N Por fim, gostaríamos de parabenizar todos os participantes da IMO 2025 por sua conquista! Estamos orgulhosos de ter muitos participantes anteriores da IMO em @OpenAI e reconhecemos que essas são algumas das mentes jovens mais brilhantes do futuro.
1,12M