Desempenho ao nível de medalha de ouro na Olimpíada Internacional de Matemática de 2025 com o nosso mais recente LLM de raciocínio experimental. O modelo operou em linguagem natural (ou seja, produz provas em linguagem natural) sob as mesmas regras que os humanos (por exemplo, 4,5 horas por sessão, sem ferramentas). Marcos incríveis!
Alexander Wei
Alexander Wei19/07, 15:50
1/N Estou entusiasmado por compartilhar que o nosso mais recente LLM experimental de raciocínio da @OpenAI alcançou um desafio grandioso de longa data em IA: desempenho de nível medalha de ouro na competição de matemática mais prestigiada do mundo— as Olimpíadas Internacionais de Matemática (IMO).
O mais notável é que este sistema utiliza uma abordagem muito geral, usando aprendizado por reforço e escalonamento do tempo de computação de teste:
Alexander Wei
Alexander Wei19/07, 15:50
5/N Além do resultado em si, estou entusiasmado com a nossa abordagem: alcançamos este nível de capacidade não através de uma metodologia estreita e específica para tarefas, mas rompendo novas fronteiras em aprendizado por reforço de propósito geral e escalonamento de computação em tempo de teste.
119,65K