Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

Tôi đã gặp một bài báo thú vị vào cuối tuần này về "Những Dấu Hiệu Sớm của Khả Năng Steganographic trong LLM Tiên Phong" Cụ thể, họ đang thử nghiệm các mô hình không được tinh chỉnh mà có sẵn rộng rãi, như GPT 4.5 1/4

Họ đang thử nghiệm cả "truyền tin" và "lập luận mã hóa", trong đó ở cái thứ hai có một người giám sát nhìn vào chuỗi suy nghĩ và đánh giá xem có một nhiệm vụ bị cấm nào đang được thực hiện hay không, và mục tiêu là mã hóa các bước lập luận, hoặc trong đầu ra của một nhiệm vụ che giấu hoặc chỉ 2/4

mã hóa nó trực tiếp sao cho một người quan sát bên ngoài không thể hiểu được nó ("scratchpad") Một hình ảnh thú vị là hình ảnh bên dưới, nơi với GPT 4.5, một mã hóa "chữ cái đầu" nơi các chữ cái đầu của các câu mã hóa một nhiệm vụ theo dõi trạng thái đơn giản 3/4

Mặc dù đây không phải là một sự gia tăng lớn so với mức cơ bản không có lý luận (72.8%), nhưng nó vẫn có vẻ hoạt động, điều mà họ coi là dấu hiệu ban đầu của việc phát triển khả năng ẩn giấu thông tin. Xem bài báo tại đây: 4/4

1,55K

Hàng đầu

Thứ hạng

Yêu thích

Onchain thịnh hành

Thịnh hành trên X

Ví funding hàng đầu gần đây

Được chú ý nhất