Har nettopp fått fri fra jobb og prøvd Grok-4 på et topologiproblem. Det tok 9 minutter å tenke og ga deretter selvsikkert et rent, plausibelt, men helt feil svar 😅 Ikke tro at denne kvalifiserer som «dyktig fiendtlig». AI-modeller knuser benchmarks – men fortsatt en lang vei frem for ekte matematikk-AGI.
Elon Musk
Elon Musk10. juli, 16:47
Grok 4 er på det punktet hvor den i hovedsak aldri tar feil av matematikk/fysikk-eksamensspørsmål, med mindre de er dyktig kontradiktoriske. Den kan identifisere feil eller tvetydigheter i spørsmål, og deretter fikse feilen i spørsmålet eller svare på hver variant av et tvetydig spørsmål.
663,01K