I takt med att modellerna utvecklas är ett viktigt säkerhetsproblem för AI vilseledande anpassning/"schemaläggning" – där AI i hemlighet kan sträva efter oavsiktliga mål. I vår uppsats "Evaluating Frontier Models for Stealth and Situational Awareness" bedömer vi om nuvarande modeller kan fungera som en systematisk modell.
78,2K