Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Präsentation der besten (und offenen) Spracherkennungsmodelle der Welt!

Sowohl die Modelle Voxtral 3B als auch Voxtral 24B gehen über die Transkription hinaus und bieten folgende Funktionen:
· Langfristiger Kontext: Mit einer Kontextlänge von 32k Tokens verarbeitet Voxtral Audios von bis zu 30 Minuten für die Transkription oder 40 Minuten für das Verständnis.
· Eingebaute Q&A und Zusammenfassungen: Unterstützt das direkte Stellen von Fragen zum Audioinhalt oder das Erstellen strukturierter Zusammenfassungen, ohne separate ASR- und Sprachmodelle verknüpfen zu müssen.
· Nativ mehrsprachig: Automatische Spracherkennung und erstklassige Leistung in den weltweit am häufigsten verwendeten Sprachen (Englisch, Spanisch, Französisch, Portugiesisch, Hindi, Deutsch, Niederländisch, Italienisch, um nur einige zu nennen), was Teams hilft, globale Zielgruppen mit einem einzigen System zu bedienen.
· Funktionsaufrufe direkt aus der Stimme: Ermöglicht das direkte Auslösen von Backend-Funktionen, Workflows oder API-Aufrufen basierend auf den gesprochenen Benutzerabsichten und verwandelt Sprachinteraktionen in umsetzbare Systembefehle ohne Zwischenparsing.
· Hochgradig fähig im Text: Beibehaltung der Textverständnisfähigkeiten seines Sprachmodell-Rückgrats, Mistral Small 3.1.
486,89K
Top
Ranking
Favoriten