Nous avons demandé à @mikeknoop (Co-fondateur, @arcprize) sur l'apprentissage continu et l'évolution des benchmarks de raisonnement en IA : "ARC V1 a été introduit en 2019. Il a été conçu pour défier l'apprentissage profond en tant que paradigme, avant que les modèles de langage ne décollent vraiment." "V2 remet en question un nouveau paradigme des systèmes de raisonnement en IA. Même si les énigmes semblent similaires à V1, V2 nécessite généralement des chaînes de raisonnement plus longues, ce qui rend les choses plus difficiles." "Maintenant, avec V3, nous définissons ce que nous appelons un benchmark de raisonnement interactif ; pour évaluer et défier la nouvelle génération de systèmes d'agents IA de pointe."
6,75K