Geração de várias pessoas inspirada em Shrek (com clonagem de voz) - isso é possível agora com um modelo TTS *único*!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav15 horas atrás
NOVO: Higgs Audio V2 de @boson_ai modelo TTS aberto e unificado com clonagem de voz, supera GPT 4o mini tts e ElevenLabs v2 🔥 > Treinado em 10 milhões de horas (discurso, música, eventos) > Construído em cima de Llama 3.2 3B > funciona em tempo real e no limite > Beats GPT-4o-mini-tts, ElevenLabs v2 em prosódia e emoção Diálogo multi-alto-falante > Clonagem 🤩 de voz zero-shot > disponível no Hugging Face Parabéns ao pessoal da Boson AI por lançar um trabalho tão brilhante e todos os detalhes em torno do modelo! 🤗
7,34K