كانت مشاهدة النموذج وهو يحل مشاكل المنظمة البحرية الدولية هذه ويحقق أداء من المستوى الذهبي أمرا سحريا. بعض الأفكار 🧵
Alexander Wei
Alexander Wei‏19 يوليو، 15:50
1 / N أنا متحمس لمشاركة أن أحدث @OpenAI المنطق التجريبي لدينا قد حقق تحديا كبيرا طويل الأمد في الذكاء الاصطناعي: أداء على مستوى الميدالية الذهبية في مسابقة الرياضيات الأكثر شهرة في العالم - أولمبياد الرياضيات الدولي (IMO).
يحل النموذج هذه المشكلات بدون أدوات مثل العجاف أو الترميز ، فهو يستخدم فقط لغة طبيعية ، ولديه أيضا 4.5 ساعة فقط. نرى السبب النموذجي على مستوى عال جدا - تجربة استراتيجيات مختلفة ، وإجراء ملاحظات من الأمثلة ، واختبار الفرضية.
إنه لأمر مجنون كيف انتقلنا من 12٪ على AIME (GPT 4o) → الذهب IMO في ~ 15 شهرا. لقد قطعنا شوطا طويلا بسرعة كبيرة. لن أتفاجأ إذا كانت النماذج ستشتق نظريات جديدة بحلول العام المقبل وتساهم في أبحاث الرياضيات الأصلية!
‏‎487.12‏K