Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Presentamos Eleven v3 (alpha), el modelo de texto a voz más expresivo de la historia.
Admite 70+ idiomas, diálogo de varios hablantes y etiquetas de audio como [emocionado], [suspiros], [risas] y [susurros].
Ahora en alfa pública y con un 80% de descuento en junio.
Este es un avance de la investigación. Requiere una ingeniería más rápida que los modelos anteriores, pero las generaciones son impresionantes.
Continuaremos afinando para mejorar la confiabilidad y el control.
La nueva arquitectura de Eleven v3 comprende profundamente el texto, ofreciendo una expresividad mucho mayor.
Y ahora puedes guiar a las generaciones de forma más directa utilizando etiquetas de audio:
- Emociones [tristes] [enojadas] [felices]
- Dirección de entrega [susurros] [gritos]
- Reacciones no verbales [risas] [carraspeo] [suspiros]
Genere diálogos de varios altavoces que suenen como una conversación real.
Eleven v3 maneja las interrupciones, los cambios de tono y las señales emocionales basadas en el contexto de la conversación.
La API pública para Eleven v3 (alpha) llegará pronto. Para acceso anticipado, comuníquese con el departamento de ventas.
Estamos trabajando en la versión en tiempo real de la v3. Para casos de uso conversacional y en tiempo real, recomendamos quedarse con v2.5 Turbo o Flash por ahora.
Creado para creadores y desarrolladores que crean herramientas multimedia.
Si está trabajando en videos, audiolibros o herramientas multimedia, v3 desbloquea un nuevo nivel de expresividad. Aprenda a aprovecharlo al máximo con nuestra guía de indicaciones:
Eleven v3 (alpha) ya está disponible:
Tiene un 80% de descuento durante junio.
Pruébalo y comparte tus mejores generaciones con nosotros.
1.41M
Populares
Ranking
Favoritas