Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Giới thiệu Eleven v3 (alpha) - mô hình Text to Speech biểu cảm nhất từ trước đến nay.
Hỗ trợ hơn 70 ngôn ngữ, đối thoại nhiều người nói và các thẻ âm thanh như [hào hứng], [thở dài], [cười], và [thì thầm].
Hiện đang ở phiên bản alpha công khai và giảm giá 80% trong tháng 6.
Đây là một bản xem trước nghiên cứu. Nó yêu cầu nhiều kỹ thuật lập trình hơn so với các mô hình trước - nhưng các kết quả tạo ra thật ngoạn mục.
Chúng tôi sẽ tiếp tục tinh chỉnh để cải thiện độ tin cậy và khả năng kiểm soát.
Kiến trúc mới của Eleven v3 hiểu sâu về văn bản - mang lại khả năng biểu đạt lớn hơn nhiều.
Và bây giờ bạn có thể hướng dẫn các thế hệ một cách trực tiếp hơn bằng cách sử dụng các thẻ âm thanh:
- Cảm xúc [buồn] [giận dữ] [vui vẻ]
- Hướng giao tiếp [thì thầm] [hét lên]
- Phản ứng phi ngôn ngữ [cười] [dọn họng] [thở dài]
Tạo ra một cuộc đối thoại nhiều người nói mà nghe giống như một cuộc trò chuyện thực sự.
Eleven v3 xử lý các sự gián đoạn, thay đổi trong giọng điệu và các tín hiệu cảm xúc dựa trên ngữ cảnh cuộc trò chuyện.
API công khai cho Eleven v3 (alpha) sẽ sớm ra mắt. Để có quyền truy cập sớm, vui lòng liên hệ với bộ phận bán hàng.
Chúng tôi đang làm việc trên phiên bản thời gian thực của v3. Đối với các trường hợp sử dụng thời gian thực và hội thoại, chúng tôi khuyên bạn nên giữ lại v2.5 Turbo hoặc Flash trong thời gian này.
Được xây dựng cho các nhà sáng tạo và nhà phát triển xây dựng công cụ truyền thông.
Nếu bạn đang làm việc với video, sách nói hoặc công cụ truyền thông - v3 mở ra một cấp độ biểu đạt mới. Tìm hiểu cách tận dụng tối đa nó với hướng dẫn gợi ý của chúng tôi:
Eleven v3 (alpha) hiện có sẵn:
Giảm giá 80% trong tháng Sáu.
Hãy thử ngay - và chia sẻ những sản phẩm tốt nhất của bạn với chúng tôi.
1,41M
Hàng đầu
Thứ hạng
Yêu thích