🎶 介紹 Audio-Flamingo 3 – 一個完全開放的 LALM,訓練於聲音、語音和音樂數據集。 🎶 處理 10 分鐘的音頻、長篇文本和語音對話。非常適合音頻問答、對話和推理。 在 @huggingface ➡️ 來自 #NVIDIAResearch.
26.81K