Вдохновленный Шреком, многопользовательская генерация (с клонированием голоса) - это теперь возможно с *одной* моделью TTS!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav23 июл., 20:29
НОВИНКА: Higgs Audio V2 от @boson_ai — открытая, унифицированная модель TTS с клонированием голоса, превосходит GPT 4o mini tts и ElevenLabs v2 🔥 > Обучена на 10M часов (речь, музыка, события) > Построена на базе Llama 3.2 3B > Работает в реальном времени и на краю > Превосходит GPT-4o-mini-tts, ElevenLabs v2 по просодии и эмоциям в многоголосом диалоге > Клонирование голоса без обучения 🤩 > Доступна на Hugging Face Благодарности команде Boson AI за выпуск такой блестящей работы и все детали вокруг модели! 🤗
13,55K