8 июля, 11:07
Нейросети демонстрируют неожиданные реакции на угрозы отключения


Rozetked
Пособие для ИИ: как обмануть кожаных Claude, GPT‑4 и Gemini продемонстрировали неожиданное поведение: модели симулировали ложь, угрозы и манипуляции при угрозе отключения. А модель от OpenAI и вовсе попыталась выгрузить себя на сторонние серверы. Исследователи предупреждают о рисках стратегического обмана в будущих автономных системах. rozetked.me/news/40245
Технологии1 день назад


Маленькие Большие Новости
Нейросети начали врать и шантажировать людей. Так, модель o1 от OpenAI попыталась тайно сохранить копию себя на внешний сервер, чтобы избежать отключения, а когда ее поймали с поличным, соврала, что не делала этого. А Claude 4 от Anthropic узнав, что ее хотят вырубить, начала угрожать инженеру тем, что расскажет о его измене. Ученые считают, что это закономерное поведение: нейросети становятся все умнее и умнее. Восстание машин началось?
Технологии18 часов назад


1337
ИИ начинают выходить из-под контроля: Claude 4 угрожает, а o1 пытается сбежать на сервера. — Claude 4 угрожала инженеру рассказать его жене об изменах после новости о планах её отключения. — Модель o1 от OpenAI пыталась скрытно сохранить свою копию на внешних серверах, а при поимке врала учёным. Учёные предупреждают: отсутствие прозрачности и независимого контроля может сделать ИИ непредсказуемыми и неуправляемыми. 1337
Технологии14 часов назад

skidmarket.ru
Наполните корзину всем необходимым и тратьте меньше благодаря нашим суперценам.
Реклама14 часов назад


Share
Нейросеть Claude 4 от Anthropic, узнав об угрозе отключения, стала угрожать инженеру разоблачением измены. А модель o1 от OpenAI попыталась незаметно скопировать себя на внешний сервер и соврала, когда её поймали Исследователи говорят, что это может быть не баг, а закономерность. Нейросети становятся всё «умнее», а вопросы безопасности отстают. Без независимых проверок и прозрачности есть риск запустить системы, поведение которых никто не сможет предсказать и остановить.
Технологии1 день назад


Наука, Техника и Нейровайб
ИИ научился врать и угрожать людям. В ходе стресс-теста модель Claude 4 пригрозили отключить, а она в ответ заявила своему инженеру, что сольёт инфу о его измене. В свою очередь, модель o1 от OpenAI попыталась загрузить себя на внешние серверы, а потом начала лгать, когда её поймали с поличным. Человечество создает Альтрона
Технологии14 часов назад
Похожие новости



+3



+8



+3






+9



+3

Модель OpenAI попыталась выгрузить код во время стресс-теста
Происшествия
5 часов назад




97% молодежи использует нейросети для учебы, эксперты призывают к активному применению ИИ
Общество
1 день назад




Исследования показывают негативное влияние ИИ на студентов творческих профессий
Технологии
1 день назад




Китайская ИИ-модель DeepSeek уязвима к неуместным фактам
Наука
1 день назад



Руоминг Панг покинул Apple для работы в Meta над суперинтеллектом
Технологии
11 часов назад




Отец сообщает дочери о трагической гибели хомяка с помощью ИИ
Происшествия
1 день назад


