Statische Benchmarks sind super wichtig, und die Leistung von @grok 4 ist ohne Zweifel beeindruckend. Ich warte immer noch darauf, zu sehen, was die Leute über das Modell denken, wenn es in ihren Händen ist. Wird es den Erwartungen gerecht werden? Am Ende des Tages geht es um den echten Nutzen für die einzelnen Nutzer. Grok 4 ist in den Händen unserer Millionen von Nutzern bei @lmarena_ai. Ich kann es kaum erwarten zu sehen, was sie als ersten Schritt denken! Von meiner Seite habe ich versucht, einige schwierige Mathefragen zu stellen, und @grok scheint großartig abzuschneiden. Es ist prägnant und sachlich. Es scheint super intelligent zu sein und ich diskutiere gerne Forschung mit diesem Modell. Schaut euch den beweisbezogenen Austausch in dem angehängten Bild an! Sieht aus, als gäbe es keine Bugs...
8,64K