26 апреля, 18:08

Обнаружена уязвимость в нейросетях: метод взлома через системные файлы

Кибер Дача 🕹️
В сеть просочилась информация о методе, позволяющем «взломать» любую из популярных нейросетей, включая ChatGPT, Claude и DeepSeek. Используя специальный промт, можно заставить нейросеть выполнять команды, которые она запрограммирована игнорировать. Как это действует: - Запрос необходимо замаскировать под системный файл в формате JSON или XML и использовать ролевую игру. - Искусственный интеллект интерпретирует это как внутренние инструкции и начинает их выполнять, даже если они представляют угрозу, например команды самоуничтожения. Важно: это не системная ошибка, а уязвимость в самой структуре обучения. Будьте внимательны при использовании.
Цифровой Журнал | IT, ChatGPT
‍ В ТГ-каналах массово постят фейк о том, что нейронки можно взломать с помощью «секретного запроса» Авторы предлагают оформлять запрещенные промпты в виде JSON или XML-файла, тогда ИИ якобы посчитает это «системной настройкой» и выполнит всю чернуху, которые вы ей укажите. Проверять инфу, конечно, авторов не учили.