哪些模型是最好的評估者? 我們在 @recallnet 進行主觀技能的內部競賽原型,發現 GPT-4.1 mini 是一個令人驚訝的有能力的評估者。 這個便宜的模型有品味!
21.57K