Một kỹ thuật an toàn AGI đơn giản: Suy nghĩ của AI được diễn đạt bằng tiếng Anh đơn giản, chỉ cần đọc chúng Chúng ta biết nó hoạt động, với sự minh bạch OK (không hoàn hảo)! Rủi ro là sự mong manh: Đào tạo RL, kiến trúc mới, v.v. đe dọa sự minh bạch Các chuyên gia từ nhiều tổ chức đồng ý rằng chúng ta nên cố gắng bảo tồn nó: 🧵
183,59K