5 つの言語で 500k サンプルの多言語トレーニング後データ: フランス語、スペイン語、イタリア語、ドイツ語、ポルトガル語。 多言語のトレーニング後のデータセットの不足に対処するために、これらのサンプルを作成し、Global MMLU、Belebele、Multi-IFなどのベンチマークでのパフォーマンスを向上させることがわかりました
7.42K