Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/N Estou entusiasmado por compartilhar que o nosso mais recente LLM experimental de raciocínio da @OpenAI alcançou um desafio grandioso de longa data em IA: desempenho de nível medalha de ouro na competição de matemática mais prestigiada do mundo— as Olimpíadas Internacionais de Matemática (IMO).

2/N Avaliámos os nossos modelos nos problemas IMO de 2025 sob as mesmas regras que os concorrentes humanos: duas sessões de exame de 4,5 horas, sem ferramentas ou internet, leitura das declarações oficiais dos problemas e escrita de provas em linguagem natural.

4/N Em segundo lugar, as submissões IMO são provas difíceis de verificar e com várias páginas. O progresso aqui exige ir além do paradigma RL de recompensas claras e verificáveis. Ao fazer isso, obtivemos um modelo que pode elaborar argumentos intrincados e à prova d'água ao nível de matemáticos humanos.




5/N Além do resultado em si, estou entusiasmado com a nossa abordagem: alcançamos este nível de capacidade não através de uma metodologia estreita e específica para tarefas, mas rompendo novas fronteiras em aprendizado por reforço de propósito geral e escalonamento de computação em tempo de teste.
6/N Na nossa avaliação, o modelo resolveu 5 dos 6 problemas da IMO 2025. Para cada problema, três ex-medalhistas da IMO avaliaram independentemente a prova submetida pelo modelo, com as pontuações finalizadas após consenso unânime. O modelo obteve 35/42 pontos no total, o suficiente para ouro! 🥇
8/N A propósito, vamos lançar o GPT-5 em breve, e estamos entusiasmados para que o experimentem. Mas só para deixar claro: o modelo LLM IMO gold é um modelo de pesquisa experimental. Não planejamos lançar nada com este nível de capacidade matemática por vários meses.
9/N Ainda assim—isto sublinha quão rápido a IA avançou nos últimos anos. Em 2021, meu orientador de doutorado @JacobSteinhardt me pediu para prever o progresso da matemática da IA até julho de 2025. Eu previ 30% no benchmark MATH (e pensei que todos os outros estavam otimistas demais). Em vez disso, temos ouro no IMO.

11/N Por último, gostaríamos de parabenizar todos os participantes do IMO 2025 pela sua conquista! Temos orgulho de ter muitos ex-participantes do IMO na @OpenAI e reconhecemos que estes são alguns dos jovens talentos mais brilhantes do futuro.
1,12M
Top
Classificação
Favoritos