Welke modellen zijn de beste evaluatoren? We doen interne competitie prototypes bij @recallnet voor subjectieve vaardigheden en ontdekken dat GPT-4.1 mini een verrassend capabele evaluator is. Het goedkope model heeft smaak!
21,59K