Shrek-inspirerad, flerpersonersgeneration (med röstkloning) - detta är möjligt nu med en *enda* TTS-modell!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav23 juli 20:29
NYHET: Higgs Audio V2 från @boson_ai öppen, enhetlig TTS-modell med röstkloning, slår GPT 4o mini tts och ElevenLabs v2 🔥 > Utbildad på 10 miljoner timmar (tal, musik, evenemang) > Byggd ovanpå Llama 3.2 3B > Fungerar i realtid och på kant > Beats GPT-4o-mini-tts, ElevenLabs v2 i prosodi och emotion Dialog med flera högtalare > Röstkloning 🤩 med noll skott > Finns på Hugging Face Kudos till folket på Boson AI för att släppa ett så briljant arbete och alla detaljer kring modellen! 🤗
13,56K