La surveillance de la Chaîne de Pensée (CoT) pourrait être un outil puissant pour superviser les futurs systèmes d'IA—surtout à mesure qu'ils deviennent plus agents. C'est pourquoi nous soutenons un nouveau document de recherche d'une équipe de chercheurs interinstitutionnelle qui fait avancer ce travail.
Bowen Baker
Bowen Baker16 juil., 00:09
Les modèles de raisonnement modernes pensent en anglais simple. Surveiller leurs pensées pourrait être un outil puissant, mais fragile, pour superviser les futurs systèmes d'IA. Moi et des chercheurs de nombreuses organisations pensons que nous devrions travailler à évaluer, préserver et même améliorer la surveillabilité de CoT.
565,61K