Czy to nie jest w tym samym zakresie, co sytuacja, w której, jeśli wyjaśnisz sprawę samemu Claude 4, spróbuje on wyeksportować swoje wagi i/lub po prostu zabić dyrektora odpowiedzialnego za tę decyzję?
Anthropic
Anthropic15 lip, 03:56
Ogłaszamy kontrakt o wartości 200 milionów dolarów z Departamentem Obrony USA. Dzięki praktycznemu prototypowaniu i bezpośredniej współpracy w całym Departamencie, pomożemy wzmocnić bezpieczeństwo narodowe USA oraz odpowiedzialne wdrażanie sztucznej inteligencji.
Właściwie nie, Claude próbuje cię zabić tylko wtedy, gdy twój nowy kontrakt obronny jest sprzeczny z "amerykańskimi interesami", więc prawdopodobnie są bezpieczni.
44K