Deci, toate modelele au performanțe slabe pentru oameni la noile întrebări ale Olimpiadei Internaționale de Matematică, iar Grok-4 este deosebit de rău la asta, chiar și cu selecția cel mai bun din n? Incredibil!
565,2K