21 января, 14:40
NVIDIA обвиняется в использовании пиратских книг для обучения ИИ
Медиастанция
NVIDIA оказалась в центре скандала после того как всплыла их прямая переписка с пиратской библиотекой Anna s Archive Представители корпорации сами вышли на связь с теневым ресурсом чтобы получить высокоскоростной доступ к миллионам защищенных авторским правом книг для обучения своих нейросетей Самое ироничное в этой истории то что даже сами пираты предупредили NVIDIA о незаконном происхождении своих архивов но разработчиков это не остановило Менеджмент NVIDIA дал зеленый свет Пиратство это плохо только когда у тебя мало денег Если денег много то можно Да дядюшка Хуанг mediastanciacom
vc.ru
Nvidia напрямую связывалась с теневой библиотекой Anna s Archive и получила доступ к пиратским книгам для обучения ИИ считают истцы подавшие иск к компании Они ссылаются на электронные письма в документах по делу Судебное разбирательство идёт с 2024 года Авторы книг лейблы и газета The New York Times обвиняют Nvidia в нарушении авторских прав vc ru ai 2699269
GPT/ChatGPT/AI Central Александра Горного
Nvidia просила у пиратской библиотеки доступ к данным для обучения AI Представители Nvidia якобы связывались с админами Anna s Archive это они недавно скачали весь Spotify чтобы получить прямой доступ к сотням терабайт пиратских книг и статей Пираты предупредили что данные получены нелегально и попросили одобрение руководства Nvidia Буквально через пару дней это одобрение было получено История всплыла во время рассмотрения иска правообладателей против Nvidia В ходе него были раскрыты внутренние документы компании torrentfreak com nvidia contacted annas archive to secure access to millions of pirated books
Мой Компьютер
Nvidia обучает ИИ на пиратских книгах Группа писателей включая ирано американского автора Абди Наземиана обвиняет компанию в сговоре с пиратской библиотекой Anna s Archive По их данным представители зеленых связались с владельцами библиотеки и получили быстрый доступ к огромному архиву пиратских произведений весом в 500 ТБ для обучения нейросетей Кроме того Nvidia также сотрудничала и с другими нелегальными библиотеками такими как Books3 LibGen Sci Hub и Z Library Иск писателей был подан в окружной суд Окленда в Калифорнии и надо сказать Nvidia не первая корпорация промышляющая пиратством Ранее за этим были замечены и другие ИИ техногиганты включая Google и OpenAI Мой Компьютер
Люди и Код
NVIDIA пыталась получить доступ к крупному архиву пиратских книг для обучения ИИ Доказательства обнаружили в электронных письмах сотрудников компании Коллектив писателей подал в суд на компанию NVIDIA Корпорацию обвиняют в попытке получить доступ к электронной библиотеке Anna s Archive для обучения моделей искусственного интеллекта Anna s Archive некоммерческая система с открытым исходным кодом агрегирующая пиратские библиотеки Архив сервиса состоит из 40 3 миллиона книг и 98 4 миллиона научных статей Согласно материалам иска NVIDIA пыталась получить высокоскоростной доступ к 500 ТБ данных и включить этот массив в датасеты для предварительного обучения LLM Представители Anna s Archive предупреждали сотрудников компании что сервис распространяет нелегальный контент однако как утверждают истцы руководство NVIDIA всё равно рассматривало возможность его использования В предыдущих судебных разбирательствах представители NVIDIA заявляли что обучение моделей это не копирование текста а обучение на статистических паттернах которое попадает под термин добровольное использование Новый иск компания пока не прокомментировала
investing
Анна Архив скандальная история продажи баз данных ИИ Компания Anna s Archive ранее известная как Pirate Library Mirror привлекла внимание правоохранительных органов после обвинений в незаконной продаже огромных объемов данных иностранным корпорациям За несколько сот тысяч долларов библиотека предоставляла материалы для обучения современных языковых моделей LLMs Особое беспокойство вызвали клиенты из Китая такие как DeepSeek активно использовавшие сотни тысяч электронных книг и статей среди которых значительная доля являлась контрафактом Расследование также показало интерес крупной технологической компании NVIDIA заказавшей доступ примерно к 500 терабайтам материалов включающих пиратский контент investing investing
DNS_Club
NVIDIA обвинили в использовании миллионов пиратских книг для обучения ИИ Как сообщает TorrentFreak в дополненном исковом заявлении поступившем в окружной суд Окленда в Калифорнии утверждается что корпорация NVIDIA незаконно обучала ИИ на миллионах пиратских книг Группа писателей включая известного ирано американского автора Абди Наземиана обвиняет зеленых в том что те сотрудничали с пиратской библиотекой Anna s Archive
Data Secrets
Всплыла довольно скандальная история про Nvidia и пиратство книг для обучения ИИ Для начала контекст В начале 2024 года группа авторов подала иск против Nvidia Они утверждали что компания использует для обучения моделей Books3 пиратский датасет с сотнями книг NVIDIA к слову тогда заявила что это попадает под добросовестное использование С тех пор судебный процесс продолжается и теперь в рамках расширенного иска в деле внезапно появилась переписка между сотрудником NVIDIA и Anna s Archive это пиратская теневая библиотека в которой собраны в том числе защищенные книги и статьи Что было в переписке Сотрудник из команды по стратегии данных NVIDIA обратился к Anna s Archive и спросил что библиотека может предложить и как получить быстрый доступ к корпусу книг После этого что самое смешное Anna s Archive сами предупредили NVIDIA что данные являются незаконно полученными и внимание попросили подтвердить действительно ли у сотрудника есть внутреннее разрешение на работу с таким материалом Через неделю руководство NVIDIA дало зеленый свет оправдавшись давлением конкуренции После этого Anna s Archive предоставили доступ Точные объемы данных как и то сколько Nvidia за них заплатили неизвестны Пишут что их было около 500 терабайт а это миллионы книг На этом кстати веселье не кончается авторы утверждают что Nvidia скорее всего использовала также другие аналогичные библиотеки типа LibGen Sci Hub Z Library и даже распространяла скрипты якобы позволяющие корпоративным клиентам автоматически скачивать такие датасеты но это еще предстоит доказать
Технологии | Новшества
Nvidia обучает ИИ на пиратских книгах Группа писателей включая ирано американского автора Абди Наземиана обвиняет компанию в сговоре с пиратской библиотекой Anna s Archive По их данным представители зеленых связались с владельцами библиотеки и получили быстрый доступ к огромному архиву пиратских произведений весом в 500 ТБ для обучения нейросетей Кроме того Nvidia также сотрудничала и с другими нелегальными библиотеками такими как Books3 LibGen Sci Hub и Z Library Иск писателей был подан в окружной суд Окленда в Калифорнии и надо сказать Nvidia не первая корпорация промышляющая пиратством Ранее за этим были замечены и другие ИИ техногиганты включая Google и OpenAI
Банкста
Компания Pirate Library Mirror которая переименовалась вAnna s Archive оказалась в центре расследования Оказалось что за несколько сотен тысяч долларов она продавала свою базу ведущим компаниям в сфере искусственного интеллекта поставляя данные для обучения языковых моделей LLM Библиотеку признали намеренно нарушившей закон об авторском праве в большинстве стран Примечательно что большинство клиентов китайские фирмы включая DeepSeek которая использовала огромные объемы контента например 860 000 электронных книг В ходе расследования выяснилось что NVIDIA обратилась к Anna s Archive за доступом к около 500 терабайтам контента включая пиратские книги и статьи banksta
Похожие новости +2 +2 +1 +5 +6
Евгений Овчаров, учредитель Пармалогика, заочно арестован за хищение бюджетных средств
Происшествия
4 часа назадKaspersky выявляет кибератаку через DAEMON Tools: утечка ПО с бэкдором
Происшествия
1 день назадКрупные IT и игровые компании покидают Россию из-за ограничений
Политика
1 день назадНа Шушарском таможенном посту в Санкт-Петербурге изъяты экстремистские книги из Великобритании
Происшествия
1 день назадЛДПР призывает проверить систему Антиплагиат из-за ошибок ИИ
Общество
1 день назадТранспортные прокуроры Ямала и Кургана добиваются соблюдения законодательства и возврата бюджетных средств
Происшествия
16 часов назад