Grok 4 está no ponto em que essencialmente nunca erra nas questões do exame de matemática / física, a menos que sejam habilmente contraditórias. Ele pode identificar erros ou ambiguidades nas perguntas e, em seguida, corrigir o erro na pergunta ou responder a cada variante de uma pergunta ambígua.
Deedy
Deedy10 de jul., 14:07
Insano que Elon Musk tenha conseguido novamente, esmagando absolutamente as guerras de IA com Grok 4. Resumindo os principais anúncios: — Gastos com RL pós-treino == gastos com pré-treino — US$ 3/M de entrada informada, US$ 15/M de saída toks, 256k contexto, preço 2x além de 128k - # 1 no Último Exame da Humanidade (problemas gerais difíceis) 44,4%, # 2 é 26,9% - # 1 em GPQA (problemas difíceis de pós-graduação) 88,9%. #2 é 86.4% - # 1 no AIME 2025 (matemática) 100%, # 2 é 98.4% - # 1 em Harvard MIT Math 96,7%, # 2 é 82,5% - # 1 em USAMO25 (matemática) 61,9%, # 2 é 49,4% - # 1 em ARC-AGI-2 (fácil para humanos, difícil para IA) 15,9%, # 2 é 8,6% - # 1 no LiveCodeBench (janeiro-maio) 79,4%, # 2 é 75,8% Grok 4 é "potencialmente melhor do que o nível de doutorado em todas as disciplinas, sem exceção".. e é muito barato. Momento massivo nas guerras de IA e Elon veio para jogar.
6,33M