Zainspirowany Shrekiem, generacja wieloosobowa (z klonowaniem głosu) - to teraz możliwe dzięki *jednemu* modelowi TTS!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav23 lip, 20:29
NOWOŚĆ: Higgs Audio V2 od @boson_ai otwarty, zjednoczony model TTS z klonowaniem głosu, przewyższa GPT 4o mini tts i ElevenLabs v2 🔥 > Wytrenowany na 10M godzin (mowa, muzyka, wydarzenia) > Zbudowany na bazie Llama 3.2 3B > Działa w czasie rzeczywistym i na krawędzi > Przewyższa GPT-4o-mini-tts, ElevenLabs v2 w zakresie prosodii i emocji w dialogu wielogłosowym > Klonowanie głosu w zerowym strzałem 🤩 > Dostępny na Hugging Face Gratulacje dla zespołu Boson AI za wydanie tak wspaniałej pracy i wszystkich szczegółów dotyczących modelu! 🤗
13,55K