S tím, jak se modely vyvíjejí, je klíčovým problémem bezpečnosti umělé inteligence klamavé zarovnání / "intriky" – kdy by umělá inteligence mohla skrytě sledovat nezamýšlené cíle. Náš článek "Hodnocení hraničních modelů pro utajení a situační povědomí" hodnotí, zda současné modely mohou plánovat.
78,17K