🧠Новое на блоге CITP от аспиранта Бойи Вэя (@wei_boyi) из лаборатории POLARIS: "'Пузырь' риска: Улучшение оценок для агентов наступательной кибербезопасности" Читайте о том, как противники могут адаптировать и модифицировать модели с открытым исходным кодом, чтобы обойти защитные меры. 👇
3,19K