لذا ، فإن جميع النماذج أقل من أداء البشر في أسئلة الأولمبياد الرياضي الدولي الجديد ، و Grok-4 سيء بشكل خاص ، حتى مع اختيار الأفضل من ن؟ لا يصدق!
‏‎478.08‏K