les grands modèles sont de grands agents mais souvent trop grands, fermés ou délicats pour être ajustés idée : entraîner un petit modèle pour créer un contexte pour un grand modèle figé, évaluer les sorties du grand modèle, utiliser cela comme récompense pour le petit groupe pour l'ajustement du contexte. plus d'infos ci-dessous
11,61K