Una semplice tecnica di sicurezza per l'AGI: i pensieri dell'IA sono in inglese semplice, basta leggerli Sappiamo che funziona, con una trasparenza OK (non perfetta)! Il rischio è la fragilità: l'addestramento RL, nuove architetture, ecc. minacciano la trasparenza Gli esperti di molte organizzazioni concordano sul fatto che dovremmo cercare di preservarla: 🧵
183,6K