I modelli di ragionamento moderni pensano in inglese semplice. Monitorare i loro pensieri potrebbe essere uno strumento potente, ma fragile, per supervisionare i futuri sistemi di intelligenza artificiale. Io e i ricercatori di molte organizzazioni pensiamo che dovremmo lavorare per valutare, preservare e persino migliorare la monitorabilità del CoT.
649,56K