Quais modelos são os melhores avaliadores? Estamos fazendo protótipos de competição interna em @recallnet para habilidades subjetivas e descobrindo que o GPT-4.1 mini é um avaliador surpreendentemente capaz. O modelo barato tem bom gosto!
21,59K