Представляємо найкращі у світі (і відкриті) моделі розпізнавання мовлення!
Моделі Voxtral 3B і Voxtral 24B виходять за рамки транскрипції з можливостями, які включають: · Довгий контекст: з довжиною контексту в 32 тисячі токенів, Voxtral обробляє аудіо до 30 хвилин для транскрипції або 40 хвилин для розуміння · Вбудовані функції запитань і відповідей та узагальнення: підтримує постановку запитань безпосередньо про аудіоконтент або створення структурованих підсумків, без необхідності ланцюжка окремих моделей ASR та мови · Багатомовність: автоматичне визначення мови та найсучасніша продуктивність найпоширеніших мов світу (англійська, іспанська, французька, португальська, хінді, німецька, голландська, італійська та інші), допомагаючи командам обслуговувати глобальну аудиторію за допомогою єдиної системи · Виклик функцій безпосередньо з голосу: дає змогу безпосередньо запускати внутрішні функції, робочі процеси або виклики API на основі голосових намірів користувача, перетворюючи голосові взаємодії на дієві системні команди без проміжних кроків аналізу. · Високі здібності до роботи з текстом: зберігає можливості розуміння тексту своєї основної мовної моделі, Mistral Small 3.1
486,88K