I benchmark static sono super importanti, e le prestazioni di @grok 4 sono senza dubbio impressionanti. Sto ancora aspettando di vedere cosa ne pensano le persone del modello quando sarà nelle loro mani. Riuscirà a soddisfare le aspettative? Alla fine della giornata, si tratta di reale utilità per gli utenti individuali. Grok 4 è nelle mani dei nostri milioni di utenti su @lmarena_ai. Non vedo l'ora di vedere cosa ne pensano come primo passo! Da parte mia, ho provato a porre alcune domande di matematica difficili, e @grok sembra fare molto bene. È conciso e fattuale. Sembra super intelligente e mi piace discutere di ricerca con questo modello. Dai un'occhiata alla prova relativa all'interscambiabilità nell'immagine allegata! Sembra che non ci siano bug...
8,63K