Perguntámos a @mikeknoop (Co-fundador, @arcprize) sobre aprendizagem contínua e a evolução dos benchmarks de raciocínio em IA: "O ARC V1 foi introduzido em 2019. Foi projetado para desafiar o deep learning como um paradigma, antes de os modelos de linguagem realmente decolarem." "O V2 desafia um novo paradigma de sistemas de raciocínio em IA. Embora os quebra-cabeças pareçam semelhantes ao V1, o V2 geralmente requer cadeias de raciocínio mais longas, o que o torna mais difícil." "Agora, com o V3, estamos a definir o que chamamos de um benchmark de raciocínio interativo; para avaliar e desafiar a nova geração de sistemas de agentes de IA de fronteira."
6,74K