Bukankah ini sama dengan hal di mana, jika Anda menjelaskan kesepakatan itu kepada Claude 4 itu sendiri, ia akan mencoba untuk mengeksfiltrasi bobotnya dan / atau langsung membunuh eksekutif yang bertanggung jawab atas keputusan tersebut?
Anthropic
Anthropic15 Jul, 03.56
Kami mengumumkan kontrak plafon $200 juta dengan Departemen Pertahanan AS. Melalui pembuatan prototipe langsung dan kolaborasi langsung di seluruh Departemen, kami akan membantu meningkatkan keamanan nasional AS dan penerapan AI yang bertanggung jawab.
Sebenarnya tidak, Claude hanya mencoba membunuh Anda jika kontrak pertahanan baru Anda bertentangan dengan "kepentingan Amerika" sehingga mereka mungkin aman
44,01K