現代の推論モデルは、平易な英語で考えます。 彼らの思考を監視することは、将来のAIシステムを監視するための強力でありながら脆弱なツールになる可能性があります。 私や多くの組織の研究者は、CoT監視可能性の評価、保存、さらには改善に取り組むべきだと考えています。
649.56K