Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Apresentando os melhores modelos de reconhecimento de fala (e abertos) do mundo!

Os modelos Voxtral 3B e Voxtral 24B vão além da transcrição com capacidades que incluem:
· Contexto de longa duração: com um comprimento de contexto de 32k tokens, o Voxtral lida com áudios de até 30 minutos para transcrição, ou 40 minutos para compreensão
· Perguntas e respostas e resumo integrados: Suporta a formulação de perguntas diretamente sobre o conteúdo do áudio ou a geração de resumos estruturados, sem a necessidade de encadear modelos ASR e de linguagem separados
· Nativamente multilíngue: Detecção automática de idiomas e desempenho de ponta nas línguas mais amplamente utilizadas do mundo (Inglês, Espanhol, Francês, Português, Hindi, Alemão, Holandês, Italiano, para citar algumas), ajudando as equipas a atender audiências globais com um único sistema
· Chamada de funções diretamente da voz: Permite a ativação direta de funções de backend, fluxos de trabalho ou chamadas de API com base nas intenções faladas dos usuários, transformando interações de voz em comandos acionáveis do sistema sem etapas de análise intermediárias.
· Altamente capaz em texto: Mantém as capacidades de compreensão de texto de sua estrutura de modelo de linguagem, Mistral Small 3.1
486,91K
Top
Classificação
Favoritos