Perguntamos a @mikeknoop (cofundador, @arcprize) sobre o aprendizado contínuo e a evolução dos benchmarks de raciocínio de IA: "O ARC V1 foi introduzido em 2019. Ele foi projetado para desafiar o aprendizado profundo como um paradigma, antes que os modelos de linguagem realmente decolassem." "O V2 desafia um novo paradigma de sistemas de raciocínio de IA. Mesmo que os quebra-cabeças sejam semelhantes ao V1, o V2 geralmente requer cadeias de raciocínio mais longas, o que o torna mais difícil." "Agora, com a V3, estamos definindo o que chamamos de benchmark de raciocínio interativo; para avaliar e desafiar a nova geração de sistemas de agentes de IA de fronteira".
6,76K