Welche Modelle sind die besten Evaluatoren? Wir machen interne Wettbewerbsprototypen bei @recallnet für subjektive Fähigkeiten und finden, dass GPT-4.1 mini ein überraschend fähiger Evaluator ist. Das günstige Modell hat Geschmack!
21,58K