熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

SCB 10X
SCB 10X 是 SCBX 集團的子公司,以“登月任務”成立,旨在通過技術創新和投資實現指數級增長。
在您的機器上離線運行強大的 Typhoon AI 模型 💻
.
前往這個 LM Studio 指南,這是一個易於設置的程序,可以在您的計算機上運行開源 AI 模型,如 Typhoon!它支持 Typhoon 2.1、Gemma、Typhoon 2、Typhoon Translate 和 Typhoon OCR 的本地 API 托管。
.
主要亮點:
✅ LM Studio 安裝和設置
✅ 理解模型格式 (GGUF vs MLX)
✅ 選擇合適的模型大小
✅ 在您的機器上使用 Typhoon Translate 和 Typhoon 文本模型
✅ 使用示例 OCR 代碼調用 LM Studio 的本地 API,而無需外部連接 API
.
👉 查看:
#SCB10X #TyphoonAI #TyphoonTranslate #TyphoonOCR #LMStudio #LocalLLM

251
AI Bootcamp: LLM 微調與部署,由 SCB 10X 和 @float16cloud 主辦,已成功結束。此次活動分享了有關微調和實際部署大型語言模型(LLMs)的關鍵知識和技術。
.
👉 主要收穫 - 由 Typhoon 主導:有效微調模型的 5 個技巧
.
1. 將超過 80% 的時間花在數據準備上(質量是基礎)
2. 創建至少兩個評估數據集:一個必須是完全未見過的數據
3. 在微調過程中,使用訓練和評估集來監控過擬合
4. 在微調前後評估模型,以確認實際改進
5. 審查和完善聊天模板——系統提示、指令格式等——良好的模板能產生更準確和表現更好的回應
.
👉 主要收穫 - 由 Float16 主導:使 LLM 在實際軟件開發中運作的 3 種技術
.
1. 選擇與目的相符的文件格式:
• .safetensors → 用於 HuggingFace——將模型權重和標記器與架構分開
• .gguf → 用於 llama-cpp、Ollama、LM-studio——更易於使用
2. 適當選擇格式:
• safetensors 用於微調
• gguf 用於推理(特別是與 OpenAI API 兼容)
3. 結構化輸出(語法)提高輸出質量:
• 使用 xgrammar、大綱、指導來塑造回應
• JSON 模式以精確調用功能
• 定義 SQL、自選題和獨特格式的自定義語法規則
#SCB10X #Typhoon #Float16 #Bootcamp #AIBootCamp




293
SEA-LION x Typhoon:東南亞的🌏🎧跨語言音訊建模 僅用泰語和英語訓練的模型如何幫助處理印尼語或泰米爾語?
.
Typhoon 與 AI Singapore 的最新合作深入探討了這個問題。我們開發了 SEA-LION-TH-AUDIO,這是一款多模態 LLM,可在不到 1,000 小時的泰語-英語音訊上進行微調。
.
研究的主要收穫:
✅ 在泰語 ASR 中,即使沒有更廣泛的 SEA 數據,其性能也優於或匹配了更大的多語言模型。
✅ 顯示出很強的零鏡頭遷移:泰語↔、印尼語和泰語→泰米爾語翻譯,儘管這些語言沒有直接的訓練數據。
✅ 事實證明,更小、更集中的訓練對於資源匱乏的場景是有效的。
.
這不是最大的模型,但它是東南亞更智慧、數據高效的 AI 的概念驗證。
.
我們看到了以下方面的真正潛力:
🔎 擴展到更多的東南亞語言(馬來語、越南語等)
🗣️ 添加語音到語音轉換功能
🤝 共用開放資源的區域協作
.
為什麼這很重要?
東南亞的語言多樣性值得包容性的 AI。通過研究跨語言遷移,我們正在為所有語言提供可訪問、高效的模式鋪平道路。
.
👉 閱讀更多:
#AudioAI #NLP #CrossLingual #SoutheastAsia #Typhoon #AISingapore #Research #SEALION

279
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可