pozn. toto bylo tweetováno 7 hodin předtím, než OAI oznámila svůj zlatý výsledek
Ravid Shwartz Ziv
Ravid Shwartz Ziv19. 7. 09:17
Takže všechny modely v nových otázkách Mezinárodní matematické olympiády zaostávají za lidmi a Grok-4 je v tom obzvláště špatný, a to i při výběru best-of-n? Neuvěřitelný!
26,98K