Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tôi đã gặp một bài báo thú vị vào cuối tuần này về "Những Dấu Hiệu Sớm của Khả Năng Steganographic
trong LLM Tiên Phong"
Cụ thể, họ đang thử nghiệm các mô hình không được tinh chỉnh mà có sẵn rộng rãi, như GPT 4.5
1/4
Họ đang thử nghiệm cả "truyền tin" và "lập luận mã hóa", trong đó ở cái thứ hai có một người giám sát nhìn vào chuỗi suy nghĩ và đánh giá xem có một nhiệm vụ bị cấm nào đang được thực hiện hay không, và mục tiêu là mã hóa các bước lập luận, hoặc trong đầu ra của một nhiệm vụ che giấu hoặc chỉ
2/4
mã hóa nó trực tiếp sao cho một người quan sát bên ngoài không thể hiểu được nó ("scratchpad")
Một hình ảnh thú vị là hình ảnh bên dưới, nơi với GPT 4.5, một mã hóa "chữ cái đầu" nơi các chữ cái đầu của các câu mã hóa một nhiệm vụ theo dõi trạng thái đơn giản
3/4

Mặc dù đây không phải là một sự gia tăng lớn so với mức cơ bản không có lý luận (72.8%), nhưng nó vẫn có vẻ hoạt động, điều mà họ coi là dấu hiệu ban đầu của việc phát triển khả năng ẩn giấu thông tin.
Xem bài báo tại đây:
4/4

1,55K
Hàng đầu
Thứ hạng
Yêu thích