Model mana yang merupakan evaluator terbaik? Kami melakukan prototipe kompetisi internal di @recallnet untuk keterampilan subjektif dan menemukan GPT-4.1 mini sebagai evaluator yang sangat cakap. Model murah memiliki rasa!
21,58K