Inspirado en Shrek, generación multipersonal (con clonación de voz) - ¡esto es posible ahora con un *único* modelo TTS!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav23 jul, 20:29
NUEVO: Higgs Audio V2 de @boson_ai, modelo TTS unificado y abierto con clonación de voz, supera a GPT 4o mini tts y ElevenLabs v2 🔥 > Entrenado en 10M de horas (habla, música, eventos) > Construido sobre Llama 3.2 3B > Funciona en tiempo real y en el borde > Supera a GPT-4o-mini-tts, ElevenLabs v2 en prosodia y emoción en diálogos multi-hablante > Clonación de voz en cero disparos 🤩 > Disponible en Hugging Face ¡Felicitaciones a la gente de Boson AI por lanzar un trabajo tan brillante y todos los detalles sobre el modelo! 🤗
13,55K