Moderne resonneringsmodeller tenker på vanlig engelsk. Å overvåke tankene deres kan være et kraftig, men skjørt, verktøy for å overvåke fremtidige AI-systemer. Jeg og forskere på tvers av mange organisasjoner mener vi bør jobbe for å evaluere, bevare og til og med forbedre CoT-overvåkningen.
649,55K