DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Präsentation der besten (und offenen) Spracherkennungsmodelle der Welt!

Sowohl die Modelle Voxtral 3B als auch Voxtral 24B gehen über die Transkription hinaus und bieten folgende Funktionen: · Langfristiger Kontext: Mit einer Kontextlänge von 32k Tokens verarbeitet Voxtral Audios von bis zu 30 Minuten für die Transkription oder 40 Minuten für das Verständnis. · Eingebaute Q&A und Zusammenfassungen: Unterstützt das direkte Stellen von Fragen zum Audioinhalt oder das Erstellen strukturierter Zusammenfassungen, ohne separate ASR- und Sprachmodelle verknüpfen zu müssen. · Nativ mehrsprachig: Automatische Spracherkennung und erstklassige Leistung in den weltweit am häufigsten verwendeten Sprachen (Englisch, Spanisch, Französisch, Portugiesisch, Hindi, Deutsch, Niederländisch, Italienisch, um nur einige zu nennen), was Teams hilft, globale Zielgruppen mit einem einzigen System zu bedienen. · Funktionsaufrufe direkt aus der Stimme: Ermöglicht das direkte Auslösen von Backend-Funktionen, Workflows oder API-Aufrufen basierend auf den gesprochenen Benutzerabsichten und verwandelt Sprachinteraktionen in umsetzbare Systembefehle ohne Zwischenparsing. · Hochgradig fähig im Text: Beibehaltung der Textverständnisfähigkeiten seines Sprachmodell-Rückgrats, Mistral Small 3.1.

486,89K

Top

Ranking

Favoriten

Onchain-Trends

Im Trend auf X

Aktuelle Top-Finanzierungen

Am bemerkenswertesten