Nowoczesne modele rozumowania myślą w prostym angielskim. Monitorowanie ich myśli może być potężnym, ale kruchym narzędziem do nadzorowania przyszłych systemów AI. Ja oraz badacze z wielu organizacji uważamy, że powinniśmy pracować nad oceną, zachowaniem, a nawet poprawą monitorowalności CoT.
649,58K