A conferência de lançamento do Grok4 pode ser descrita como medíocre, e a performance específica que testei deixou um pouco a desejar. Aqui está um resumo do conteúdo da conferência👇 1. Desempenho: O Grok 4 teve um desempenho excepcional em testes em várias áreas, com uma taxa de acerto em problemas difíceis como o "exame final da humanidade" muito superior a modelos semelhantes. As versões multi-agente são ainda melhores, e obteve nota máxima em testes de programação, matemática, entre outros, alcançando um nível acadêmico equivalente ao de um estudante de pós-graduação, superando a maioria dos humanos. 2. Desenvolvimento do treinamento: De Grok 2 a 4, a quantidade de treinamento aumentou em ordens de magnitude, sendo a quarta geração 100 vezes maior que a segunda. A transição da terceira para a quarta geração focou em raciocínio e aprendizado por reforço, utilizando técnicas como aumento de dados e supercomputadores para realizar raciocínio de princípios e auto-correção. 3. Aplicações funcionais: A latência na interação por voz foi reduzida pela metade, com a adição de uma voz natural; após a abertura da API, a aplicação se expandiu amplamente em áreas como simulação comercial, pesquisa científica e desenvolvimento de jogos, como aumentar o valor líquido dos negócios de máquinas de venda automática, acelerar a pesquisa científica e desenvolver jogos rapidamente. 4. Planos futuros: Um modelo de codificação será lançado em algumas semanas, visando melhorar a capacidade multimodal; nas próximas 3 a 4 semanas, será iniciado o treinamento de geração de vídeo, com o objetivo de criar um modelo mais rápido e inteligente, promovendo a evolução da civilização humana.
8,45K