Har precis slutat jobbet och provat Grok-4 på ett grundutbildning topologi problem. Det tog 9 minuter att tänka och sedan gav jag självsäkert ett rent, plausibelt, men helt felaktigt svar 😅 Tro inte att den här kvalificerar sig som "skickligt kontradiktorisk". AI-modeller krossar riktmärken – men ligger fortfarande långt fram för verklig matematisk AGI.
Elon Musk
Elon Musk10 juli 16:47
Grok 4 is at the point where it essentially never gets math/physics exam questions wrong, unless they are skillfully adversarial. It can identify errors or ambiguities in questions, then fix the error in the question or answer each variant of an ambiguous question.
663,05K