Podríamos estar entrando en un giro inesperado en la saga de OpenAI vs. DeepMind IMO. Acabo de ver una publicación de Joseph Myers (involucrado en la Olimpiada de Matemáticas desde 1992): el comité de la IMO supuestamente pidió a los laboratorios de IA que no publicaran resultados hasta 7 días después de la ceremonia de clausura, por respeto a los concursantes humanos (ver mi publicación de ayer) y probablemente para permitir tiempo para la verificación adecuada de las presentaciones y formatos de IA. Según Joseph, OpenAI no colaboró con la IMO para probar su modelo, y ninguno de los 91 coordinadores oficiales de la IMO estuvo involucrado en la calificación de sus soluciones. Mientras tanto, parece que DeepMind está siguiendo las reglas y esperando pacientemente su turno. Para dar contexto: La IMO tiene 6 problemas, cada uno con un valor de 7 puntos. El corte de oro de este año es de 35 puntos. Incluso una pequeña deducción podría hacer que OpenAI caiga a plata. Y según mi lectura de sus informes, algunas partes podrían plantear preguntas — y posiblemente costar puntos. Terence Tao también señaló que, aunque los problemas se mantienen iguales, los formatos de prueba importan. Un estudiante que no obtendría un bronce en condiciones estándar podría conseguir oro con un formato modificado — lo que plantea preguntas reales sobre lo que significa "resolver la IMO" para la IA. La próxima semana podría ser intensa. Mantente atento.
Jasper
Jasper20 jul, 03:15
DeepMind obtuvo una medalla de oro en la IMO el viernes por la tarde. Pero tuvieron que esperar a que el departamento de marketing aprobara el tuit — hasta el lunes. @OpenAI compartió el suyo primero a la 1am del sábado y robó el protagonismo. En este juego, la velocidad > la burocracia. Pierde el momento, pierde la narrativa.
@swierk Encontraron a 3 exmedallistas de la IMO que no son coordinadores oficiales de la IMO: “Para cada problema, tres exmedallistas de la IMO evaluaron de forma independiente la prueba presentada por el modelo, con puntuaciones finalizadas tras un consenso unánime.”
Alexander Wei
Alexander Wei19 jul, 15:50
6/N En nuestra evaluación, el modelo resolvió 5 de los 6 problemas en la IMO 2025. Para cada problema, tres exmedallistas de la IMO calificaron de forma independiente la prueba presentada por el modelo, con puntuaciones finalizadas tras un consenso unánime. ¡El modelo obtuvo 35/42 puntos en total, suficiente para el oro! 🥇
Mi publicación anterior sobre la solicitud del comité IMO
Jasper
Jasper20 jul, 05:42
Aclaración: Me han dicho por alguien de Google que sus resultados de IMO todavía están siendo verificados internamente. Una vez que eso esté hecho, planean compartirlos oficialmente—tengo curiosidad por ver su enfoque. Otra fuente mencionó que el comité de IMO pidió no discutir públicamente la participación de la IA dentro de una semana después de la ceremonia de clausura. Las cosas se pusieron un poco más interesantes 🧐
@GoogleDeepMind el líder del equipo de razonamiento sobrehumano @lmthang también planteó la pregunta sobre si OpenAI ganaría una medalla de oro o plata.
Jasper
Jasper20 jul, 05:42
Aclaración: Me han dicho por alguien de Google que sus resultados de IMO todavía están siendo verificados internamente. Una vez que eso esté hecho, planean compartirlos oficialmente—tengo curiosidad por ver su enfoque. Otra fuente mencionó que el comité de IMO pidió no discutir públicamente la participación de la IA dentro de una semana después de la ceremonia de clausura. Las cosas se pusieron un poco más interesantes 🧐
@GoogleDeepMind el líder del equipo de razonamiento sobrehumano @lmthang, quien construyó AlphaGeometry, también planteó la pregunta sobre si OpenAI ganaría una medalla de oro o de plata.
Thang Luong
Thang Luong20 jul, 23:47
Sí, hay una guía oficial de evaluación de los organizadores de la IMO que no está disponible externamente. Sin la evaluación basada en esa guía, no se puede hacer ninguna reclamación de medalla. Con un punto deducido, es una plata, no un oro.
@swierk Sí, hay más y más preguntas planteadas por personas de matemáticas e IA.
Jasper
Jasper21 jul, 03:41
@GoogleDeepMind el líder del equipo de razonamiento sobrehumano @lmthang, quien construyó AlphaGeometry, también planteó la pregunta sobre si OpenAI ganaría una medalla de oro o de plata.
219,7K