Nota: isto foi tweetado 7 horas antes de a OAI anunciar o seu resultado de ouro.
Ravid Shwartz Ziv
Ravid Shwartz Ziv19/07, 09:17
Então, todos os modelos têm um desempenho inferior ao dos humanos nas novas questões da Olimpíada Internacional de Matemática, e o Grok-4 é especialmente ruim nisso, mesmo com a seleção do melhor de n? Inacreditável!
26,99K