Статические бенчмарки очень важны, и производительность @grok 4, безусловно, впечатляет. Я все еще жду, чтобы увидеть, что люди думают о модели, когда она окажется у них в руках. Оправдает ли она ожидания? В конце концов, все сводится к реальной полезности для отдельных пользователей. Grok 4 уже в руках наших миллионов пользователей в @lmarena_ai. Не могу дождаться, чтобы увидеть, что они думают на первом этапе! С моей стороны, я пытался задать несколько сложных математических вопросов, и @grok, похоже, справляется отлично. Он краток и фактический. Кажется, очень умным, и мне нравится обсуждать исследования с этой моделью. Посмотрите на доказательство, связанное с обменностью, на прикрепленном изображении! Похоже, что нет ошибок...
8,65K