Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Представляємо найкращі у світі (і відкриті) моделі розпізнавання мовлення!

Моделі Voxtral 3B і Voxtral 24B виходять за рамки транскрипції з можливостями, які включають:
· Довгий контекст: з довжиною контексту в 32 тисячі токенів, Voxtral обробляє аудіо до 30 хвилин для транскрипції або 40 хвилин для розуміння
· Вбудовані функції запитань і відповідей та узагальнення: підтримує постановку запитань безпосередньо про аудіоконтент або створення структурованих підсумків, без необхідності ланцюжка окремих моделей ASR та мови
· Багатомовність: автоматичне визначення мови та найсучасніша продуктивність найпоширеніших мов світу (англійська, іспанська, французька, португальська, хінді, німецька, голландська, італійська та інші), допомагаючи командам обслуговувати глобальну аудиторію за допомогою єдиної системи
· Виклик функцій безпосередньо з голосу: дає змогу безпосередньо запускати внутрішні функції, робочі процеси або виклики API на основі голосових намірів користувача, перетворюючи голосові взаємодії на дієві системні команди без проміжних кроків аналізу.
· Високі здібності до роботи з текстом: зберігає можливості розуміння тексту своєї основної мовної моделі, Mistral Small 3.1
486,88K
Найкращі
Рейтинг
Вибране