Inspirado em Shrek, geração multi-pessoa (com clonagem de voz) - isso é possível agora com um *único* modelo TTS!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav23/07, 20:29
NOVO: Higgs Audio V2 da @boson_ai modelo TTS unificado e aberto com clonagem de voz, supera o GPT 4o mini tts e o ElevenLabs v2 🔥 > Treinado em 10M horas (fala, música, eventos) > Construído em cima do Llama 3.2 3B > Funciona em tempo real e na borda > Supera o GPT-4o-mini-tts, ElevenLabs v2 em prosódia e emoção Diálogo multi-falante > Clonagem de voz zero-shot 🤩 > Disponível no Hugging Face Parabéns à equipe da Boson AI por lançar um trabalho tão brilhante e por todos os detalhes em torno do modelo! 🤗
13,56K