Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Smart Turn v2: open source, nativní zvuková detekce odbočení ve 14 jazycích.
Nový kontrolní bod open source, otevřených dat, otevřeného trénovacího kódu, sémantického VAD modelu na @huggingface, @FAL a @pipecat_ai.
- 3x rychlejší inference (12 ms na L40)
- 14 jazyků (o 13 více než V1, která byla pouze v angličtině)
- Nová syntetická datová sada 'chirp_3_all' s ~163 tisíci zvukovými vzorky
- 99% přesnost na uložených "human_5_all" testovacích datech
Dobrá detekce odbočení je pro hlasové agenty kritická. Tento model "rozumí" sémantickým i zvukovým vzorcům a zmírňuje kompromis hlasové umělé inteligence mezi nežádoucí latencí tahu a tím, že agent přerušuje lidi dříve, než domluví svůj názor.
Trénovací skripty pro @modal_labs i místní školení jsou v úložišti. Chceme, aby bylo co nejjednodušší přispívat do tohoto modelu nebo jej přizpůsobovat!
Zde je ukázka s modelem smart-turn s výchozím nastavením, zaměřená na obecné dosažení celkové doby detekce otočení 400 ms. Můžete také vyladit věci tak, aby byly rychlejší.
Pomoci můžete přispíváním dat, architektonickými experty nebo čištěním open source dat! Čti dál ...
36,9K
Top
Hodnocení
Oblíbené