A medida que los modelos avanzan, una preocupación clave de seguridad de la IA es la alineación engañosa / "maquinación" – donde la IA podría perseguir encubiertamente objetivos no deseados. Nuestro artículo "Evaluando Modelos de Frontera para la Sigilosidad y la Conciencia Situacional" evalúa si los modelos actuales pueden maquinizar.
78,19K