Проста техніка безпеки AGI: думки ШІ викладені простою англійською мовою, просто прочитайте їх Ми знаємо, що це працює, з нормальною (не ідеальною) прозорістю! Ризик полягає в крихкості: навчання RL, нові архітектури тощо загрожують прозорості Експерти з багатьох організацій сходяться на думці, що треба намагатися його зберегти: 🧵
183,6K