Vi introduserer Eleven v3 (alpha) – den mest uttrykksfulle tekst-til-tale-modellen noensinne. Støtter 70+ språk, dialog med flere høyttalere og lydtagger som [begeistret], [sukk], [ler] og [hvisker]. Nå i offentlig alfa og 80 % rabatt i juni.
Dette er en forhåndsvisning av forskning. Det krever mer rask konstruksjon enn tidligere modeller - men generasjonene er fantastiske. Vi vil fortsette å finjustere for å forbedre påliteligheten og kontrollen.
Den nye arkitekturen til Eleven v3 forstår tekst dypt - og gir mye større uttrykksfullhet. Og nå kan du veilede generasjoner mer direkte ved hjelp av lydtagger: - Følelser [trist] [sint] [lykkelig] - Leveringsretning [hvisker] [roper] - Ikke-verbale reaksjoner [ler] [klarner halsen] [sukker]
Generer dialog med flere høyttalere som høres ut som en ekte samtale. Eleven v3 håndterer avbrudd, endringer i tone og emosjonelle signaler basert på samtalekontekst.
Offentlig API for Eleven v3 (alfa) kommer snart. For tidlig tilgang, vennligst kontakt salgsavdelingen. Vi jobber med sanntidsversjonen av v3. For sanntids- og samtalebrukstilfeller anbefaler vi å holde deg til v2.5 Turbo eller Flash inntil videre.
Bygget for skapere og utviklere som bygger medieverktøy. Hvis du jobber med videoer, lydbøker eller medieverktøy, låser v3 opp et nytt nivå av uttrykksfullhet. Lær hvordan du får mest mulig ut av det med vår veiledning:
Eleven v3 (alfa) er tilgjengelig nå: Det er 80 % rabatt i løpet av juni. Prøv det - og del dine beste generasjoner med oss.
1,41M