Самый сложный экзамен по математике в старшей школе в мире, 6 задач за 9 часов IMO 2025, прошел на этой неделе. Модели ИИ показали плохие результаты. Gemini 2.5 Pro набрал наивысший балл — всего 13 из 42, стоимостью $431.97, в оценке лучших из 32. Порог для бронзовой медали составил 19. Искусственному интеллекту еще далеко до решения сложной математики.
Вот более красивая визуализация производительности модели на MathArena
P6 определенно была самой сложной и интересной задачей. Большинство людей могут её понять, но очень немногие могут её решить. Все модели набрали 0/7.
Небольшое исправление:
Alexander Wei
Alexander Wei14 часов назад
1/N Я рад поделиться тем, что наш последний экспериментальный LLM от @OpenAI достиг давнего грандиозного вызова в ИИ: золотого медального уровня на самом престижном математическом соревновании в мире — Международной математической олимпиаде (IMO).
76,37K