现代推理模型用简单的英语思考。 监控它们的思维可能是一个强大但脆弱的工具,用于监督未来的人工智能系统。 我和许多组织的研究人员认为,我们应该努力评估、保护,甚至改善 CoT 的可监控性。
649.56K