Грустный робот в Grok 4. Это снова показывает, насколько осторожным нужно быть с преувеличенными заявлениями от закрытых релизов, которые говорят привычное "всё кончено". Контаминация тестов, которую нельзя проверить, делает бенчмарки выглядящими отлично, но при новых проблемах происходит крах.
17,08K