Lấy cảm hứng từ Shrek, thế hệ đa người (với việc sao chép giọng nói) - điều này giờ đây có thể thực hiện với một *mô hình* TTS *duy nhất*!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav20:29 23 thg 7
MỚI: Higgs Audio V2 từ @boson_ai, mô hình TTS mở, thống nhất với khả năng nhân bản giọng nói, vượt qua GPT 4o mini tts và ElevenLabs v2 🔥 > Được đào tạo trên 10 triệu giờ (nói, nhạc, sự kiện) > Xây dựng trên Llama 3.2 3B > Hoạt động theo thời gian thực và trên thiết bị cục bộ > Vượt qua GPT-4o-mini-tts, ElevenLabs v2 về ngữ điệu & cảm xúc trong đối thoại đa người nói > Nhân bản giọng nói không cần đào tạo 🤩 > Có sẵn trên Hugging Face Cảm ơn những người tại Boson AI đã phát hành một tác phẩm tuyệt vời như vậy và tất cả các chi tiết xung quanh mô hình!
13,56K