25 июня, 11:29

Суд признал законным обучение ИИ на купленных книгах: прецедент для индустрии

Подготовлено редакцией Tek.fmДайджест Telegram-каналов

#Калифорния #Anthropic #Сша #Уильям Олсап

Окружной суд в Калифорнии вынес смешанное решение по иску авторов книг к Anthropic — создателю Claude AI. Судья признал "fair use" тренировку AI на авторских книгах и конвертацию печатных копий в цифровые, но не согласился с использованием пиратских копий для создания "центральной библиотеки". Это потенциально важный прецедент для всей индустрии AI. Если решение устоит, то AI-компании смогут использовать авторские материалы для обучения моделей — при условии, что материалы получены легально. Суд отметил, что технология ИИ "является одной из самых трансформационных, которые многие из нас увидят в своей жизни". Однако Anthropic все же предстоит суд присяжных по вопросу ущерба от использования пиратских копий. Судья подчеркнул, что "тот факт, что Anthropic позже купила копию книги, которую ранее украла из интернета, не освободит её от ответственности за кражу, но может повлиять на размер ущерба". Изначально авторы требовали до $750 млрд по $150 тысяч за каждую из 5 млн книг , но теперь возмещение будет касаться только пиратских копий. Решение может быть обжаловано.

Общество317 дней назад

Все о блокчейн/мозге/space/WEB 3.0 в России и мире

1-й судебный прецедент по ИИ и авторским правам, Claude в деле Вчера федеральный судья США постановил, что Anthropic может обучать Claude на купленных книгах без разрешения авторов. Anthropic скачала более 7 млн пиратских копий книг с нелегальных сайтов Books3, LibGen, PiLiMi , включая произведения истцов. Позже компания также купила миллионы печатных книг, отсканировала каждую страницу и создала цифровые копии. Для этого она даже наняла бывшего сотрудника Google, который специализируется на этой работе. Судья решил: 1. Использование книг для обучения языковых моделей подпадает под добросовестное использование. 2. Нет карт-бланша на пиратство под предлогом ИИ-разработки. 3. Признал обучение LLM чрезвычайно трансформативным использованием, сравнив его с тем, как люди учатся читать и писать. Это создает сильный прецедент для будущих дел. Почему Anthropic выиграла? Авторы не смогли доказать, что Claude копирует их тексты в выходных данных. Истцы выступили с исками только в отношении процесса обучения, что оказалось недостаточно. Какие последствия этого решения? 1. Для Anthropic и других: - Могут продолжать обучение на купленном контенте - Должны удалить пиратские копии или заплатить штрафы - Вероятно, увеличат закупки легального контента. 2. Для стартапов в ИИ: - Повышается барьер входа нужны деньги на контент - Но четкие правила игры лучше неопределенности. 3. Для крупных ИТ-гигантов: - Их преимущество в капитале становится важнее - Могут позволить себе массовые закупки контента Это решение может привести к: 1. Развитию новых бизнес-моделей для лицензирования контента 2. Созданию специализированных датасетов для обучения ИИ 3. Возможному законодательному вмешательству для уточнения правил. Слабые места решения: Неясность границ: Что если компания купит книги, обучит модель и вернет их? Международный аспект: Как это работает с контентом из других юрисдикций? Будущие технологии: Применимо ли это к другим типам ИИ?

Общество316 дней назад

ForkLog FEED

Федеральный судья Уильям Алсуп постановил, что компания Anthropic имела право обучать модели на опубликованных книгах без разрешения авторов. Это первый случай, когда суд поддержал утверждение ИИ-компании касательно того, что доктрина добросовестного использования может освободить от ответственности при применении защищенных авторским правом материалов в ходе обучения больших языковых моделей. Ранее авторы, художники и издатели подали десятки исков против разработчиков искусственного интеллекта. Хотя решение судьи Алсупа не гарантирует, что другие суды займут аналогичную позицию, оно может стать прецедентом в пользу технологических компаний. Решения зависят от интерпретации доктрины добросовестного использования — принципа, который позволяет применять защищенные авторским правом материалы без разрешения правообладателя в определенных случаях. Новости AI YouTube

Общество316 дней назад

LegalTech

® Создан судебный прецедент по обучению ИИ без получения согласия авторов. Федеральный судья в Сан-Франциско вынес постановление, что использование компанией Anthropic книг без разрешения авторов для обучения своей языковой модели является законным в соответствии с законодательством США об авторском праве. Для обучения своей большой языковой модели Claude, компания Anthropic скачала несколько миллионов пиратских копий книг с нелегальных сайтов, а также приобрела несколько миллионов бумажных экземпляров, отсканировала каждую страницу и создала цифровые копии в «центральной библиотеке» компании. Авторы Andrea Bartz, Charles Graeber и Kirk Wallace Johnson подали иск за использование их книг при обучении языковой модели. Судья William Alsupy указал, что обучение ИИ на законно приобретённых книгах без разрешения авторов является добросовестным использованием fair use . Также судья указал, что если тексты приобретены легально, их использование для обучения ИИ является «чрезвыйчайно трансформативным» т.е. создает некий новый смысл и соответственно не является нарушением. Однако хранение в «центральной библиотеке» Anthropic более 7 миллионов пиратских копий книг суд признал нарушением авторских прав и назначил новое разбирательство для определения размера компенсации.

Общество316 дней назад

vc.ru

Суд в Калифорнии решил, что использование Anthropic книг без разрешения авторов для обучения ИИ-моделей можно считать «добросовестным использованием». Но вот хранение «пиратских» книг нарушило авторские права — за это стартапу придётся ответить vc.ru/ai/2062010

Общество316 дней назад

GPT/ChatGPT/AI Central Александра Горного

Anthropic разрешили учить AI на купленных книгах Anthropic выиграла часть дела по авторским правам: суд признал, что использовать купленные бумажные книги для обучения AI — это допустимое «добросовестное использование». Но за миллионы пиратских копии книг, скачанных из интернета, Anthropic всё же ответит — эта часть дела вынесена в отдельное разбирательство. Судья отметил, что пиратство не оправдывается, если книги можно было купить легально. Anthropic заявила, что использовала материалы не для копирования, а чтобы «создавать нечто новое». Теперь суд будет разбираться, насколько это соответствует действительности.

Общество316 дней назад

Product Management & AI

Главные юридические новости ИИ: в 2021 году основатели Anthropic скачали 7+ млн. книг из онлайн-библиотек Books3, Library Genesis, LibGen, Pirate Library Mirror для обучения Claudi, зная, что они пиратские. Уже в 2024 году Anthropic начали покупать миллионы печатных книг, наняв бывшего руководителя Google по сканированию Тома Терви, которому было поручено «получить все книги в мире», избегая при этом «юридической суеты». Субподрядчики снимали с книг переплёты, обрезали страницы по размеру и сканировалии их в PDF, выбрасывая бумажные оригиналы. Самым важным аспектом этого дела является вопрос о том, считается ли обучение LLM на нелицензированных данных «добросовестным использованием»? Судья постановил, что да. Аргументация «почему» занимает несколько страниц документа, вот ключевое: Все читают тексты, а затем пишут новые тексты. Возможно, что вам придется заплатить за то, чтобы получить текст в свои руки в первую очередь. Но заставить кого-то платить за использование книги каждый раз, когда её читают, каждый раз, когда её вызывают из памяти, каждый раз, когда её позже используют, когда пишут что-то новое новыми способами, было бы немыслимо. Веками мы читали и перечитывали книги. Мы восхищались, запоминали и усваивали их темы, их существенные моменты и их стилистические решения. P.S. Судья, подписавший это решение весьма интересная личность – Уильям Хаскелл Олсап председательствовал на судебных процессах присяжных по делу Oracle vs Google в 2012-2016 годах, где он использовал свой любительский опыт программирования на BASIC, чтобы оспорить заявления, выдвинутые юристами в рамках этого дела.

Общество316 дней назад

Федеральный суд США подтвердил право Anthropic обучать свои модели на купленных книгах без разрешения авторов. Это признали «добросовестным использованием». По американскому закону 1976 года, интеллектуальную собственность можно использовать без разрешения, но только для блага общества в целом. Но скачивание и хранение компанией 7 млн пиратских книг под это не попадает, дело вынесено в отдельное разбирательство, а Anthropic грозит штраф. В ходе процесса открылись интересные детали. Например, стартап потратил миллионы долларов на скупку бумажных книг. После сканирования они выбрасывались.

AI и точка.

Федеральный суд США подтвердил право Anthropic обучать свои модели на купленных книгах без разрешения авторов. Это признали «добросовестным использованием». По американскому закону 1976 года, интеллектуальную собственность можно использовать без разрешения, но только для блага общества в целом. Но скачивание и хранение компанией 7 млн пиратских книг под это не попадает, дело вынесено в отдельное разбирательство, а Anthropic грозит штраф. В ходе процесса открылись интересные детали. Например, стартап потратил миллионы долларов на скупку бумажных книг. После сканирования они выбрасывались.

Общество316 дней назад

Компания Anthropic добилась серьезной победы: федеральный суд признал, что обучать нейросети на книгах, если книги куплены. В этом случае ни издатели, ни автор, ни правообладатели не имеют права выдвигать никакие претензии. Правда попутно выяснилось, что корпорация использовала не только легальные источники, но и миллионы пиратских копий, скачанных с теневых сайтов. Но мы же помним главный закон современного копирайта: Копирайт – он только для бедных. Так что как-нибудь выкрутятся.

Медиастанция

Компания Anthropic добилась серьезной победы: федеральный суд признал, что обучать нейросети на книгах, если книги куплены. В этом случае ни издатели, ни автор, ни правообладатели не имеют права выдвигать никакие претензии. Правда попутно выяснилось, что корпорация использовала не только легальные источники, но и миллионы пиратских копий, скачанных с теневых сайтов. Но мы же помним главный закон современного копирайта: Копирайт – он только для бедных. Так что как-нибудь выкрутятся.

Общество316 дней назад

Коммерсантъ FM

Интеллект не обделили правами Разработчик искусственного интеллекта впервые выиграл суд по авторскому праву. Речь идет об американской компании Anthropic — это один из главных конкурентов OpenAI. В 2024 году несколько писателей подали против нее иск. Они заявили, что разработчик без разрешения использовал их книги, чтобы обучить свою модель ИИ. Однако суд решил, что это можно считать добросовестным использованием. Такая концепция описывает случаи, когда разрешение правообладателя не требуется. Чем важно решение? И как оно повлияет на другие подобные споры? Екатерина Смирнова, адвокат, партнер компании Digital&Analogue Partners: «Нормы права, которые были разработаны исключительно для отношений, в которых участвуют люди, были применены по отношению к модели ИИ. С точки зрения правовой логики, в решении нет ничего нового, потому что это добросовестное использование. Любой университет использует книги, защищаемые авторским правом, и делает это весьма законно, опираясь на доктрину fair use, потому что целью является добросовестное использование, то есть обучение. В данном деле судья решил, что если мы учим языковую модель, никаких исключений не предусмотрено. Сомневаюсь, что это станет повсеместной практикой. У доктрины добросовестного использования есть одно очень важное изъятие, которое говорит, что никакое добросовестное использование не покрывается, если вы вдруг создаете конкурента, или по смыслу ваша языковая модель может конкурировать с первоисточником».

Общество316 дней назад