كان أصعب امتحان رياضيات في المدرسة الثانوية في العالم ، وهو 6 مشكلات 9 ساعات IMO 2025 ، هذا الأسبوع. كان أداء نماذج الذكاء الاصطناعي ضعيفا. سجل Gemini 2.5 Pro أعلى سجل ، فقط 13/42 ، بتكلفة 431.97 دولارا ، في أفضل 32 إيفال. كان قطع البرونز 19. طريق طويل لنقطعه للحصول على الذكاء الاصطناعي لحل الرياضيات الصعبة.
إليك تصور أكثر جمالا لأداء النموذج على MathArena
كان P6 بالتأكيد أصعب مشكلة وأكثرها إثارة للاهتمام. يمكن لمعظم الناس فهمها ، لكن قلة قليلة منهم يمكنهم حلها. سجلت جميع الموديلات 0/7.
تصحيح صغير:
Alexander Wei
Alexander Weiمنذ 14 ساعةً
1 / N أنا متحمس لمشاركة أن أحدث @OpenAI المنطق التجريبي لدينا قد حقق تحديا كبيرا طويل الأمد في الذكاء الاصطناعي: أداء على مستوى الميدالية الذهبية في مسابقة الرياضيات الأكثر شهرة في العالم - أولمبياد الرياضيات الدولي (IMO).
‏‎76.36‏K