Assistir ao modelo resolver esses problemas da IMO e alcançar um desempenho de nível ouro foi mágico. Alguns pensamentos 🧵
Alexander Wei
Alexander Wei19 de jul., 15:50
1 / N Estou animado para compartilhar que nosso mais recente LLM de raciocínio experimental @OpenAI alcançou um grande desafio de longa data em IA: desempenho em nível de medalha de ouro na competição de matemática mais prestigiada do mundo - a Olimpíada Internacional de Matemática (IMO).
O modelo resolve esses problemas sem ferramentas como lean ou codificação, ele usa apenas linguagem natural e também tem apenas 4,5 horas. Vemos a razão do modelo em um nível muito alto - experimentando diferentes estratégias, fazendo observações a partir de exemplos e testando hipóteses.
É uma loucura como passamos de 12% no AIME (GPT 4o) → ouro IMO em ~ 15 meses. Chegamos muito longe, muito rapidamente. Eu não ficaria surpreso se, no próximo ano, os modelos estivessem derivando novos teoremas e contribuindo para a pesquisa matemática original!
487,16K