Les LLMs sont généralement évalués avec des métriques automatiques sur des ensembles de tests standard, mais les métriques et les ensembles de tests sont développés indépendamment. Cela soulève une question cruciale : Pouvons-nous concevoir des métriques automatiques spécifiquement pour exceller sur les ensembles de tests que nous priorisons ? Réponse : Oui !
11,34K