热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

SCB 10X
SCB 10X 是 SCBX 集团的子公司,以“登月任务”成立,旨在通过技术创新和投资实现指数级增长。
在您的计算机上离线运行强大的 Typhoon AI 模型 💻
.
前往 LM Studio 的指南,这是一个易于设置的程序,可以在您的计算机上运行开源 AI 模型,如 Typhoon!它支持 Typhoon 2.1、Gemma、Typhoon 2、Typhoon Translate 和 Typhoon OCR 的本地 API 托管。
.
主要亮点:
✅ LM Studio 安装和设置
✅ 理解模型格式(GGUF 与 MLX)
✅ 选择合适的模型大小
✅ 在您的计算机上使用 Typhoon Translate 和 Typhoon 文本模型
✅ 使用示例 OCR 代码调用 LM Studio 的本地 API,无需外部连接 API
.
👉 查看:
#SCB10X #TyphoonAI #TyphoonTranslate #TyphoonOCR #LMStudio #LocalLLM

253
AI训练营:大型语言模型(LLM)的微调与部署,由SCB 10X和@float16cloud组织,已成功结束。此次活动分享了关于微调和实际部署大型语言模型(LLMs)的重要知识和技术。
.
👉关键要点 - 由Typhoon主导:有效微调模型的5个技巧
.
1. 将超过80%的时间花在数据准备上(质量是基础)
2. 创建至少两个评估数据集:一个必须是完全未见过的数据
3. 在微调过程中,使用训练集和评估集监控过拟合
4. 在微调前后评估模型,以确认实际改进
5. 审查和完善聊天模板——系统提示、指令格式等——好的模板能产生更准确和更高效的响应
.
👉关键要点 - 由Float16主导:使LLM在实际软件开发中工作的3种技术
.
1. 选择与目的相匹配的文件格式:
• .safetensors → 用于HuggingFace——将模型权重和分词器与架构分开
• .gguf → 用于llama-cpp、Ollama、LM-studio——更易于使用
2. 适当选择格式:
• safetensors用于微调
• gguf用于推理(特别是与OpenAI API兼容时)
3. 结构化输出(语法)提高输出质量:
• 使用xgrammar、大纲、指导来塑造响应
• JSON模式用于精确的函数调用
• 为SQL、多选选择和独特格式定义自定义语法规则
#SCB10X #Typhoon #Float16 #训练营 #AI训练营




295
SEA-LION x Typhoon:东南亚的跨语言音频建模 🌏🎧 仅仅通过泰语和英语训练的模型如何能帮助印尼语或泰米尔语?
.
Typhoon与新加坡人工智能的最新合作深入探讨了这个问题。我们开发了SEA-LION-TH-Audio,这是一个在不到1000小时的泰英音频上微调的多模态LLM。
.
研究的关键要点:
✅ 在泰语ASR中超越或匹配更大的多语言模型——即使没有更广泛的东南亚数据。
✅ 展现出强大的零样本迁移:泰语↔印尼语和泰语→泰米尔语翻译,尽管在这些语言中没有直接的训练数据。
✅ 更小、更专注的训练在低资源场景中证明是有效的。
.
这不是最大的模型——但它是东南亚更智能、数据高效的人工智能的概念验证。
.
我们看到真正的潜力在于:
🔎 扩展到更多东南亚语言(马来语、越南语等)
🗣️ 增加语音到语音的能力
🤝 区域合作以共享开放资源
.
这有什么重要性?
东南亚的语言多样性值得包容的人工智能。通过研究跨语言迁移,我们正在为所有语言铺平通往可访问、高效模型的道路。
.
👉 阅读更多:
#音频AI #自然语言处理 #跨语言 #东南亚 #Typhoon #新加坡人工智能 #研究 #SEA-LION

281
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可