Detta twittrades 7 timmar innan OAI tillkännagav sitt guldresultat
Ravid Shwartz Ziv
Ravid Shwartz Ziv19 juli 09:17
Så alla modeller presterar sämre än människor på de nya frågorna i den internationella matematiska olympiaden, och Grok-4 är särskilt dålig på det, även med bäst av n-urval? Otrolig!
27K