哪些模型是最好的评估者? 我们在@recallnet进行内部竞争原型,评估主观技能,发现GPT-4.1 mini是一个令人惊讶的优秀评估者。 这个便宜的模型真有品味!
21.58K