Zapytaliśmy @mikeknoop (współzałożyciela, @arcprize) o ciągłe uczenie się i ewolucję benchmarków rozumowania AI: "ARC V1 został wprowadzony w 2019 roku. Został zaprojektowany, aby wyzwać głębokie uczenie jako paradygmat, zanim modele językowe naprawdę zyskały na popularności." "V2 stawia wyzwanie nowemu paradygmatowi systemów rozumowania AI. Chociaż zagadki wyglądają podobnie do V1, V2 generalnie wymaga dłuższych łańcuchów rozumowania, co czyni je trudniejszymi." "Teraz, z V3, definiujemy to, co nazywamy interaktywnym benchmarkiem rozumowania; aby ocenić i wyzwać nową generację systemów agentów AI na granicy możliwości."
6,75K