思維鏈(CoT)監控可能成為監督未來 AI 系統的強大工具——特別是當它們變得更加自主時。這就是為什麼我們支持一個跨機構研究團隊推進這項工作的新研究論文。
Bowen Baker
Bowen Baker7月16日 00:09
現代推理模型以簡單的英語思考。 監控它們的思維可能是一種強大但脆弱的工具,用於監督未來的 AI 系統。 我和來自許多組織的研究人員認為,我們應該努力評估、保護,甚至改善 CoT 監控能力。
565.6K