На китайской DeepSeek R1 проверили 50 способов «взлома» ИИ. Сработали все

2 часов назад 5

Исследователи обнаружили, что ИИ-чатбот R1 компании DeepSeek уязвим для нескольких типов атак, а его функции безопасности не способны предотвратить известные джейлбрейки. Такие джейлбрейки позволяют пользователям обходить ограничения, призванные удержать чатбота от создания вредного или незаконного контента.

На китайской DeepSeek R1 проверили 50 способов «взлома» ИИ. Сработали все

Исследователи Cisco протестировали модель DeepSeek, используя стандартные запросы из известной библиотеки HarmBench. Они сосредоточились на таких категориях, как вред, киберпреступность и дезинформация. Модель R1 показала низкие результаты по сравнению с другими моделями, включая модель o1 от OpenAI. Из 50 опробованных джейлбрейков модель не прошла ни одну.

Эксперты по безопасности, например Алекс Поляков из Adversa AI, предупреждает, что, хотя некоторые атаки могут быть исправлены, риски остаются всегда. Он подчеркивает, что модели ИИ нуждаются в постоянном тестировании и мониторинге, чтобы предотвратить использование этих уязвимостей.

Прочитать статью целиком