500k muestras de datos multilingües posteriores al entrenamiento en 5 idiomas: francés, español, italiano, alemán y portugués. Para abordar la falta de conjuntos de datos multilingües posteriores al entrenamiento, creamos estas muestras y descubrimos que mejoran el rendimiento en puntos de referencia como Global MMLU, Belebele y Multi-IF
7.42K