Quais modelos são os melhores avaliadores? Estamos a fazer protótipos de competição interna na @recallnet para habilidades subjetivas e a descobrir que o GPT-4.1 mini é um avaliador surpreendentemente capaz. O modelo barato tem gosto!
21,59K