Abbiamo chiesto a @mikeknoop (Co-fondatore, @arcprize) riguardo all'apprendimento continuo e all'evoluzione dei benchmark di ragionamento dell'IA: "ARC V1 è stato introdotto nel 2019. È stato progettato per sfidare il deep learning come paradigma, prima che i modelli linguistici decollassero davvero." "V2 sfida un nuovo paradigma dei sistemi di ragionamento dell'IA. Anche se i puzzle sembrano simili a V1, V2 richiede generalmente catene di ragionamento più lunghe, il che lo rende più difficile." "Ora, con V3, stiamo definendo quello che chiamiamo un benchmark di ragionamento interattivo; per valutare e sfidare la nuova generazione di sistemi agenti di IA all'avanguardia."
6,75K