500k monsters van meertalige post-training data in 5 talen: Frans, Spaans, Italiaans, Duits en Portugees. Om het gebrek aan meertalige post-training datasets aan te pakken, hebben we deze monsters gemaakt en ontdekt dat ze de prestaties verbeteren op benchmarks zoals Global MMLU, Belebele en Multi-IF.
9,2K