500 ألف عينة من بيانات ما بعد التدريب متعددة اللغات ب 5 لغات: الفرنسية والإسبانية والإيطالية والألمانية والبرتغالية. لمعالجة الافتقار إلى مجموعات بيانات ما بعد التدريب متعددة اللغات ، أنشأنا هذه العينات ووجدنا أنها تحسن الأداء على معايير مثل Global MMLU و Belebele و Multi-IF
‏‎7.42‏K