Chain of Thought (CoT) Monitoring könnte ein leistungsstarkes Werkzeug zur Überwachung zukünftiger KI-Systeme sein – insbesondere, da sie agentischer werden. Deshalb unterstützen wir ein neues Forschungspapier von einem interinstitutionellen Team von Forschern, das diese Arbeit vorantreibt.
Bowen Baker
Bowen Baker16. Juli, 00:09
Moderne Denkmodelle denken in einfachem Englisch. Die Überwachung ihrer Gedanken könnte ein mächtiges, aber fragiles Werkzeug zur Überwachung zukünftiger KI-Systeme sein. Ich und Forscher aus vielen Organisationen sind der Meinung, dass wir daran arbeiten sollten, die Überwachbarkeit von CoT zu bewerten, zu bewahren und sogar zu verbessern.
565,6K