توضيح أداء ARC-AGI ل o3 أكدت OpenAI: * o3 الذي تم إصداره هو نموذج مختلف عما اختبرناه في ديسمبر 2024 * جميع مستويات الحوسبة o3 التي تم إصدارها أصغر من الإصدار الذي اختبرناه * لم يتم تدريب o3 الذي تم إصداره على بيانات ARC-AGI ، ولا حتى مجموعة القطار * تم ضبط o3 الذي تم إصداره لاستخدام الدردشة / المنتج ، والذي يقدم نقاط القوة والضعف في ARC-AGI ماذا ستفعل جائزة ARC: * سنقوم بإعادة اختبار o3 الذي تم إصداره (جميع مستويات الحوسبة) ونشر النتائج المحدثة. سيتم تصنيف الدرجات السابقة على أنها "معاينة" * سنقوم باختبار وإصدار نتائج o4-mini في أقرب وقت ممكن * سنقوم باختبار o3-pro بمجرد توفرها
‏‎127.36‏K