Teknik keamanan AGI sederhana: pemikiran AI dalam bahasa Inggris sederhana, baca saja Kami tahu itu berhasil, dengan transparansi OK (tidak sempurna)! Risikonya adalah kerapuhan: pelatihan RL, arsitektur baru, dll mengancam transparansi Para ahli dari banyak organisasi setuju bahwa kita harus mencoba melestarikannya: 🧵
183,62K