المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
SEA-LION x Typhoon: نمذجة صوتية عبر اللغات لجنوب شرق آسيا 🌏🎧 كيف يمكن لنموذج مدرب على التايلاندية والإنجليزية فقط أن يساعد في اللغة الإندونيسية أو التاميلية؟
.
أحدث تعاون مع الذكاء الاصطناعي في سنغافورة يغوص في هذا السؤال. قمنا بتطوير SEA-LION-TH-Audio ، وهو LLM متعدد الوسائط تم ضبطه بدقة على أقل من 1,000 ساعة من الصوت التايلاندي الإنجليزي.
.
النقاط الرئيسية من البحث:
✅ تفوق أو تطابق النماذج الأكبر متعددة اللغات في ASR التايلاندية - حتى بدون بيانات SEA أوسع.
✅ أظهر نقلا قويا بدون طلقة: التايلاندية ↔ الإندونيسية والتايلاندية → الترجمات التاميلية ، على الرغم من عدم وجود بيانات تدريب مباشرة بتلك اللغات.
✅ أثبت التدريب الأصغر والأكثر تركيزا فعاليته في السيناريوهات منخفضة الموارد.
.
هذا ليس أكبر نموذج - ولكنه دليل على مفهوم الذكاء الاصطناعي الأكثر ذكاء وكفاءة في استخدام البيانات في جنوب شرق آسيا.
.
نرى إمكانات حقيقية في:
🔎 التوسع في المزيد من لغات جنوب شرق آسيا (الملايو والفيتنامية وما إلى ذلك)
🗣️ إضافة إمكانات تحويل الكلام إلى كلام
🤝 التعاون الإقليمي من أجل الموارد المفتوحة المشتركة
.
لماذا يهم؟
يستحق التنوع اللغوي في جنوب شرق آسيا الذكاء الاصطناعي الشامل. من خلال دراسة النقل عبر اللغات، نمهد الطريق لنماذج يمكن الوصول إليها وفعالة لجميع لغاتنا.
.
👉 اقرأ أكثر:
#AudioAI #NLP #CrossLingual #SoutheastAsia #Typhoon #AISingapore #Research #SEALION

306
الأفضل
المُتصدِّرة
التطبيقات المفضلة