خرجت للتو من العمل وجربت Grok-4 في مشكلة طوبولوجيا البكالوريوس. استغرق الأمر 9 دقائق للتفكير ثم أعطى بثقة إجابة 😅 نظيفة ومعقولة ولكنها خاطئة تماما لا تعتقد أن هذا الشخص مؤهل على أنه "عدائي بمهارة". نماذج الذكاء الاصطناعي هي معايير ساحقة - ولكنها لا تزال أمامها طريق طويل بالنسبة ل AGI الرياضيات الحقيقية.
Elon Musk
Elon Musk‏10 يوليو، 16:47
Grok 4 في النقطة التي لا تخطئ فيها أبدا في أسئلة امتحان الرياضيات / الفيزياء ، إلا إذا كانت عدائية بمهارة. يمكنه تحديد الأخطاء أو الغموض في الأسئلة ، ثم إصلاح الخطأ في السؤال أو الإجابة على كل متغير من الأسئلة الغامضة.
‏‎663.04‏K