500 ribu sampel data pasca-pelatihan multibahasa dalam 5 bahasa: Prancis, Spanyol, Italia, Jerman, dan Portugis. Untuk mengatasi kurangnya kumpulan data pasca-pelatihan multibahasa, kami membuat sampel ini dan menemukan bahwa mereka meningkatkan kinerja pada tolok ukur seperti Global MMLU, Belebele, dan Multi-IF
7,42K