Podemos estar entrando em uma reviravolta na saga OpenAI vs. DeepMind IMO. Acabei de ver uma postagem de Joseph Myers (envolvido na Olimpíada de Matemática desde 1992): o comitê da IMO teria pedido aos laboratórios de IA que não publicassem os resultados até 7 dias após a cerimônia de encerramento - por respeito aos competidores humanos (veja meu post ontem) e provavelmente para dar tempo para a verificação adequada dos envios e formatos de IA. De acordo com Joseph, a OpenAI não colaborou com a IMO para testar seu modelo, e nenhum dos 91 coordenadores oficiais da IMO estava envolvido na classificação de suas soluções. Enquanto isso, parece que a DeepMind está seguindo as regras e esperando pacientemente sua vez. Para contextualizar: A IMO tem 6 problemas, cada um valendo 7 pontos. O corte de ouro deste ano é de 35 pontos. Mesmo uma pequena dedução pode derrubar a OpenAI para a prata. E pela minha leitura de seus artigos, algumas partes podem levantar questões - e possivelmente custar pontos. Terence Tao também apontou que, embora os problemas permaneçam os mesmos, os formatos de teste são importantes. Um aluno que não obteria um bronze em condições padrão pode encontrar ouro com uma configuração modificada - o que levanta questões reais sobre o que "resolver a IMO" significa para a IA. A próxima semana pode ficar picante. Fique ligado.
Jasper
Jasper20 de jul., 03:15
A DeepMind conquistou uma medalha de ouro na IMO na tarde de sexta-feira. Mas eles tiveram que esperar que o marketing aprovasse o tweet - até segunda-feira. @OpenAI compartilhou o deles pela primeira vez à 1h do sábado e roubou os holofotes. Neste jogo, a velocidade > a burocracia. Perca o momento, perca a narrativa.
@swierk Eles encontraram 3 ex-medalhistas da IMO que não eram coordenadores oficiais da IMO: "Para cada problema, três ex-medalhistas da IMO classificaram independentemente a prova enviada pelo modelo, com pontuações finalizadas após consenso unânime."
Alexander Wei
Alexander Wei19 de jul., 15:50
6/N Em nossa avaliação, o modelo resolveu 5 dos 6 problemas da IMO de 2025. Para cada problema, três ex-medalhistas da IMO classificaram independentemente a prova enviada pelo modelo, com pontuações finalizadas após consenso unânime. O modelo ganhou 35/42 pontos no total, o suficiente para o ouro! 🥇
Meu post anterior sobre a pergunta do comitê da IMO
Jasper
Jasper20 de jul., 05:42
Esclarecimento: Alguém do Google me disse que seus resultados da IMO ainda estão sendo verificados internamente. Feito isso, eles planejam compartilhá-los oficialmente - curiosos para ver sua abordagem. Outra fonte mencionou que o comitê da IMO pediu para não discutir publicamente o envolvimento da IA dentro de uma semana após a cerimônia de encerramento. As coisas ficaram um pouco mais interessantes 🧐
@GoogleDeepMind líder da equipe de raciocínio sobre-humano @lmthang também levantou a questão sobre se a OpenAI ganharia um ouro ou prata
Jasper
Jasper20 de jul., 05:42
Esclarecimento: Alguém do Google me disse que seus resultados da IMO ainda estão sendo verificados internamente. Feito isso, eles planejam compartilhá-los oficialmente - curiosos para ver sua abordagem. Outra fonte mencionou que o comitê da IMO pediu para não discutir publicamente o envolvimento da IA dentro de uma semana após a cerimônia de encerramento. As coisas ficaram um pouco mais interessantes 🧐
@GoogleDeepMind líder da equipe de raciocínio sobre-humano @lmthang que construiu a AlphaGeometry também levantou a questão sobre se a OpenAI ganharia uma medalha de ouro ou prata
Thang Luong
Thang Luong20 de jul., 23:47
Sim, existe uma diretriz oficial de marcação dos organizadores da IMO que não está disponível externamente. Sem a avaliação baseada nessa diretriz, nenhuma reivindicação de medalha pode ser feita. Com um ponto deduzido, é uma prata, não ouro.
@swierk sim, há cada vez mais questões levantadas por pessoas de matemática e IA
Jasper
Jasper21 de jul., 03:41
@GoogleDeepMind líder da equipe de raciocínio sobre-humano @lmthang que construiu a AlphaGeometry também levantou a questão sobre se a OpenAI ganharia uma medalha de ouro ou prata
219,71K