3 марта, 16:02
Исследования ETH Zurich и Anthropic ставят под сомнение анонимность пользователей в интернете


Denis Sexy IT 🤖
Я анон лол меня не вычислят постепенно превращается в самоуспокоение Наткнулся на пейпер про деанонимизацию с помощью LLM агентов arxiv org html 2602 16800v1 авторы построили агентскую систему которая деанонимизировала 68 пользователей с точностью в 90 Идея простая АИ агент берёт ваши публичные тексты и делает то что раньше делал душный человек или осинтер только теперь быстрее дешевле и без усталости смотрит стиль письма темы географию таймлайны микро детали в стиле я однажды купил гараж и тп Например оставили 10 20 постов за пару лет в каждом по одной улике по отдельности каждый пост бесполезен а вместе отпечаток АИ Агенты хороши именно в том чтобы эти улики собрать и склеить Код не выкладывают но работает примерно так 1 Сначала собирают датасет посты комменты био ники и тп 2 Вытаскивают сигналы профессия город интересы язык и привычки 3 Сжимают что нашли в профиль резюме и ищут похожих кандидатов в датасете 4 Дальше делают ранжирование по совпадениям несколько маркеров должны сойтись 5 И так по кругу пока не получится максимальное количество профилей на базе датасета Хоть авторы и не выложили код воспроизводится он очень просто поэтому если вы правда переживаете за свою личность на какой то площадке я бы советовал фильтровать детали я ради интереса конвертировал пейпер в агентский скилл и оно работает даже в таком примитивном виде так что я бы ждал что эти системы станут только лучше через N лет скилл не выложу Анонимность теперь всё меньше про смешной токсичный никнейм и всё больше про дисциплину текста


PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
Исследования ETH Zurich и Anthropic показали что с помощью доступных AI моделей можно идентифицировать псевдонимы пользователей интернета всего за несколько долларов Эти результаты ставят под сомнение основные предпосылки о анонимности в сети PRO AI OFFICIAL

SecurityLab.ru
Анонимности больше нет ИИ научился находить ваше реальное имя по случайным комментариям Большие языковые модели вышли на новый уровень деанонимизации Исследование Саймона Лермена показало что современные ИИ системы способны сопоставлять анонимные аккаунты с реальными людьми по нескольким разрозненным публикациям в интернете Речь уже не о ручном OSINT разборе отдельных случаев а о масштабируемом подходе который можно применять на уровне целых платформ В экспериментах использовали данные Hacker News Reddit LinkedIn и обезличенные интервью ученых В одном из сценариев модель восстанавливала связь между профилем Hacker News и LinkedIn после удаления прямых идентификаторов сначала отбирала 100 наиболее вероятных кандидатов затем проводила дополнительную проверку и выбирала лучший вариант В тестах с Reddit ИИ заново объединял искусственно разделенные фрагменты истории одного аккаунта а при росте выборки до десятков тысяч кандидатов точность снижалась постепенно без резкого падения Отдельно автор проверил метод на наборе Anthropic Interviewer модель смогла установить личности 9 из 125 участников Вывод исследования выглядит довольно прямолинейно даже редкое хобби город место работы или участие в конференции уже формируют уникальный цифровой отпечаток По мере развития ИИ стоимость такой идентификации будет снижаться а риски для анонимности целевого фишинга и других атак наоборот расти кибербезопасность анонимность LLM SecurityLab в Telegram MAX Поддержите нас бустами


IT и безопасность
Нейросети убили анонимность в сети Исследователи выяснили что большие языковые модели невероятно эффективны в задаче сопоставления неструктурированных данных и прекрасно справляются с определением личности даже по обрывкам информации В рамках исследования LLM удалось Сопоставить анонимные аккаунты с реальными профилями LinkedIn среди десятков тысяч кандидатов Объединить историю постов пользователя даже если её специально разделили по разным темам или времени Вычислить реальных личностей ученых из полностью обезличенных интервью К слову с масштабированием этого процесса нет никаких проблем поэтому делиться информацией из реальной жизни в интернете становится всё менее безопасно

GPT/ChatGPT/AI Central Александра Горного
AI легко находит реальных людей по текстам в интернете ETH Zurich и Anthropic выяснили что личности анонимных пользователей интернета можно без особых затрат раскрыть через доступные AI модели Для эксперимента взяли 338 профилей с форума Hacker News и показали AI агенту их сообщения Подсказки типа имен и ссылок на соцсети из набора данных удалили Агент самостоятельно определял профессию местоположение хобби и политические взгляды человека всё что можно прочитать между строк Потом он сопоставил эти данные с пулом из 89 тысяч профилей Linkedin и успешно деанонимизировал две трети пользователей Кроме Hacker News по похожему сценарию получилось раскрыть личности группы пользователей Reddit Главный вывод учёных Чем больше сообщений человек оставляет в сети тем проще его идентифицировать arxiv org abs 2602 16800


NN
Пользователей соцсетей научились деанонить по комментариям Для этого ученым хватило ИИ поисковика на базе ChatGPT Grok и Gemini Система изучала факты о людях на LinkedIn и сопоставляла их с анонимными постами на Hacker News А еще искала одних и тех же людей в разных сообществах Reddit Алгоритм с точностью 90 распознал 68 юзеров Обычные аналитические методы без ИИ показали результат около 0 По расчетам авторов метод будет эффективным на уровне 27 даже при выборке 100 млн человек



Чёрный Треугольник
ИИ способен раскрыть вашу реальную личность по анонимным постам в интернете Команда из MATS Research ETH Zurich и Anthropic опубликовала работу об онлайн анонимности Коллеги создали полностью автоматизированный пайплайн деанонимизации на базе LLM который работает по методологии ESRC Extract извлечение признаков Search поиск по эмбеддингам Reason логический анализ совпадений и Calibrate калибровка уверенности Суть в том что ИИ агент читает ваши анонимные комментарии и посты вычленяет из них косвенные улики метаданные ваши навыки знания интересы стиль письма а затем самостоятельно ищет совпадения по открытым источникам в сети То на что у живого следователя ушли бы годы агент делает за минуты На выборке из 338 пользователей Hacker News агент корректно идентифицировал 226 человек На Reddit при связывании разных аккаунтов одного пользователя метод показал 90 точности Отдельно исследователи проверили метод на датасете анонимизированных интервью Anthropic со 125 учёными и даже там смогли идентифицировать как минимум 9 человек несмотря на то что данные были специально отредактированы для защиты приватности Стоимость проверки одного профиля составляет от 1 до 4 а весь эксперимент обошёлся менее чем в 2000 News Soft Gear Links


КПО 🧠 Анна Руднева
Новое исследование из Anthropic озвучило самые мрачные ранние прогнозы конспирологов Оно показало что современные нейронные сети умеют деанонимизировать авторов любых комментов в интернете буквально за пару минут и всего по нескольким сообщениям В эксперименте ИИ вычислил 68 людей с точностью в 90 Имея две базы данных с псевдонимами каждая из которых содержит неструктурированный текст написанный этим человеком или о нем мы реализуем масштабируемый конвейер атак в котором используются большие языковые модели для 1 извлечения признаков связанных с личностью 2 поиска возможных совпадений с помощью семантических эмбеддингов и 3 анализа наиболее подходящих кандидатов для подтверждения совпадений и снижения количества ложных срабатываний По сравнению с предыдущими исследованиями в области деанонимизации например в рамках конкурса Netflix для которых требовались структурированные данные или ручная разработка признаков наш подход работает непосредственно с необработанным пользовательским контентом на любых платформах Наши результаты показывают что практическая анонимность защищающая пользователей под псевдонимами в интернете больше не работает и что модели угроз для конфиденциальности в сети нуждаются в пересмотре Сами ученые так и подытожили практической анонимности в сети больше не существует anna kpo ЧАТ БОТ САЙТ ВК Бастион


AI Insider
ИИ может связать поддельные онлайн имена с реальными пользователями Любой кто публикует в Интернете под псевдонимом знает что их личность теоретически может быть раскрыта Но большинство людей предполагают что никто не будет прилагать усилия Новое исследование предполагает что предположение больше не действует По мнению исследователей большие языковые модели теперь могут полностью автоматически сопоставлять псевдонимные онлайн профили с реальными людьми за один четыре доллара за профиль и в течение нескольких минут а не часов Ключевое понимание заключается не в том что ИИ лучше чем следователь человек Он улавливает те же подсказки которые заметил бы опытный аналитик профессиональные детали интересы и случайные упоминания о том где кто то живет или как он живет Но что бы человек не занимал часы языковая модель выбивает за считанные минуты

🤖 The Bell Tech
ИИ научился деанонимизировать пользователей по комментариям в соцсетях НАСТОЯЩИЙ МАТЕРИАЛ ИНФОРМАЦИЯ ПРОИЗВЕДЕН И РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ THE BELL ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА THE BELL 18 Группа исследователей обнаружила что большие языковые модели могут по набору анонимных постов установить реальную личность пользователя То что раньше требовало кропотливой ручной работы и OSINT теперь может выполнить ИИ агент быстро дешево и довольно точно Что случилось AI инженер Саймон Лермен и его коллеги представили работу Large Scale Online Deanonymization with LLMs в которой оценили способности LLM устанавливать личность пользователей по анонимным постам на разных площадках Эксперименты проводились на данных Hacker News Reddit LinkedIn а также на обезличенных интервью из датасета Anthropic Идея не нова Еще в начале 2000 х профессор Гарварда Латанья Суини пришла к выводу что 87 населения США можно идентифицировать всего по трем параметрам почтовому индексу полу и дате рождения Но на практике деанонимизация долго оставалась трудоемким ручным процессом данные разбросаны не структурированы и собрать из них портрет конкретного человека мог разве что опытный аналитик LLM ускоряют и автоматизируют этот процесс причем делают это экономически эффективно утверждают Лермен и его соавторы Как это работает Сначала модель извлекает из комментариев пользователя косвенные сведения Затем с помощью поиска на основе эмбеддингов векторных математических отпечатков текста формируется пул из 100 наиболее вероятных кандидатов и на финальном шаге LLM рассуждает и выбирает наилучшее совпадение Для проверки в одном из тестов исследователи отобрали 338 пользователей Hacker News чьи профили содержали ссылку на LinkedIn После удаления прямых идентификаторов модели предлагалось восстановить соответствие между анонимизированным аккаунтом и реальным человеком Модель дала верный ответ в 226 случаях из 338 67 При этом точность составила 90 то есть в тех случаях когда система вообще выдавала результат она почти всегда оказывалась права В другом эксперименте историю одного аккаунта Reddit искусственно делили по времени и по тематическим сообществам Задачей модели было сшить фрагменты обратно Комбинация эмбеддингов и логического анализа значительно превзошла базовые методы методы сопоставления по метаданным и активности По мере увеличения пула кандидатов до десятков тысяч точность снижалась плавно без обвала Авторы экстраполировали результаты на базы в 100 млн пользователей и заключили что при достаточных вычислительных мощностях уже можно атаковать крупные платформы А с развитием LLM порог входа будет только снижаться Приводится в исследовании и реальный кейс На датасете обезличенных интервью ученых модель смогла установить личности 9 из 125 участников Но эталонных данных для данной задачи не было и результаты проверялись вручную Весь эксперимент обошелся примерно в 2000 Стоимость деанонимизации одного профиля от 1 до 4 правда это все в экспериментальных условиях в реальной жизни цифра была бы совсем другой Почему это важно Авторы перечисляют несколько сценариев злоупотреблений Правительства могут использовать технологию для преследования журналистов и активистов корпорации для построения сверхточных рекламных профилей а злоумышленники для целевого фишинга и социальной инженерии Тем не менее в сети напоминают что деанонимизация по косвенным признакам известна давно Часть пользователей указывает на ограниченность экспериментальных условий а некоторый отмечают что LLM не создают принципиально новую угрозу а лишь автоматизируют уже существующие методы Как бы то ни было исследование не отменяет значимости базовой цифровой гигиены и осторожности Чтобы не остаться без новостей после блокировки Telegram прямо сейчас подпишитесь на наши почтовые рассылки Это можно сделать бесплатно

Похожие новости



+17










+6



+5




Нейросеть Claude ограничивает доступ для пользователей из России
Происшествия
4 часа назад


+17
Китайские власти удаляют аккаунты блогеров, запрещая демонстрацию роскоши
Происшествия
2 часа назад



Anthropic запускает режим Сновидений для самообучения ИИ агентов
Технологии
1 день назад


ЛДПР призывает проверить систему Антиплагиат из-за ошибок ИИ
Общество
1 день назад


+6
Instagram очищает платформу: миллионы подписчиков потеряны у известных блогеров
Происшествия
22 часа назад


+5
ChatGPT внедряет функцию оповещения близких при угрозе самоповреждения
Технологии
4 часа назад

