nb ceci a été tweeté 7 heures avant qu'OAI n'annonce son résultat en or
Ravid Shwartz Ziv
Ravid Shwartz Ziv19 juil., 09:17
Donc, tous les modèles sous-performent les humains sur les nouvelles questions de l'Olympiade Internationale de Mathématiques, et Grok-4 est particulièrement mauvais à ce sujet, même avec la sélection best-of-n ? Incroyable !
26,99K