Preguntamos a @mikeknoop (Co-fundador, @arcprize) sobre el aprendizaje continuo y la evolución de los benchmarks de razonamiento de IA: "ARC V1 se introdujo en 2019. Fue diseñado para desafiar el aprendizaje profundo como paradigma, antes de que los modelos de lenguaje realmente despegaran." "V2 desafía un nuevo paradigma de sistemas de razonamiento de IA. Aunque los acertijos parecen similares a V1, V2 generalmente requiere cadenas de razonamiento más largas, lo que lo hace más difícil." "Ahora, con V3, estamos definiendo lo que llamamos un benchmark de razonamiento interactivo; para evaluar y desafiar la nueva generación de sistemas de agentes de IA de frontera."
6,76K