Hinweis: Dies wurde 7 Stunden bevor OAI ihr Gold-Ergebnis bekannt gab, getwittert.
Ravid Shwartz Ziv
Ravid Shwartz Ziv19. Juli, 09:17
Also, alle Modelle schneiden bei den neuen Fragen der Internationalen Mathematik-Olympiade schlechter ab als Menschen, und Grok-4 ist dabei besonders schlecht, selbst mit der besten Auswahl aus mehreren Versuchen? Unglaublich!
26,99K