مستوحى من Shrek ، جيل متعدد الأشخاص (مع استنساخ الصوت) - هذا ممكن الآن مع نموذج TTS * واحد *!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav‏23 يوليو، 20:29
جديد: Higgs Audio V2 من @boson_ai مفتوح ، نموذج TTS الموحد مع استنساخ الصوت ، يتفوق على GPT 4o mini tts و ElevenLabs v2 🔥 > تدرب على 10 ملايين ساعة (الكلام والموسيقى والأحداث) > مبني فوق اللاما 3.2 3B يعمل > في الوقت الفعلي وعلى حافة الهاوية > يتفوق على GPT-4o-mini-tts و ElevenLabs v2 في حوار العروض والعاطفة متعددة المتحدثين > استنساخ 🤩 الصوت بدون طلقة > متوفر على Hugging Face مجد للأشخاص في Boson الذكاء الاصطناعي لإطلاق مثل هذا العمل الرائع وجميع التفاصيل حول النموذج! 🤗
‏‎13.55‏K