Наблюдать, как модель решает эти задачи IMO и достигает золотого уровня производительности, было волшебно. Несколько мыслей 🧵
Alexander Wei
Alexander Wei19 июл., 15:50
1/N Я рад поделиться тем, что наш последний экспериментальный LLM от @OpenAI достиг давнего грандиозного вызова в ИИ: золотого медального уровня на самом престижном математическом соревновании в мире — Международной математической олимпиаде (IMO).
Модель решает эти проблемы без инструментов, таких как lean или кодирование, она просто использует естественный язык и также имеет всего 4,5 часа. Мы видим, как модель рассуждает на очень высоком уровне - пробуя разные стратегии, делая наблюдения из примеров и тестируя гипотезы.
С ума сойти, как мы прошли от 12% на AIME (GPT 4o) → к IMO gold всего за ~ 15 месяцев. Мы проделали огромный путь за очень короткое время. Я бы не удивился, если к следующему году модели начнут выводить новые теоремы и вносить вклад в оригинальные математические исследования!
487,12K