一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

随着模型的进步，一个关键的人工智能安全问题是欺骗性对齐/"策划"——即人工智能可能秘密追求意想不到的目标。我们的论文《评估前沿模型的隐蔽性和情境意识》评估了当前模型是否能够策划。

78.16K