Os modelos de raciocínio modernos pensam em inglês simples. Monitorar seus pensamentos pode ser uma ferramenta poderosa, mas frágil, para supervisionar futuros sistemas de IA. Eu e pesquisadores de muitas organizações achamos que devemos trabalhar para avaliar, preservar e até melhorar a monitorabilidade do CoT.
649,6K