17 июля, 11:47

Apple и другие компании использовали видео с YouTube для обучения своего искусственного интеллекта без разрешения

Apple без разрешения использовала видео с YouTube для обучения своего ИИ Apple Intelligence.  То же самое делали Anthropic, Nvidia и Salesforce.    Технологические компании обучали искусственный интеллект на субтитрах, полученных из 170 тысяч видео. Среди каналов фигурируют MrBeast, MKBHD, ABC News, BBC, The New York Times, The Verge и Vox.  Компании использовали коллекцию материалов под названием Pile, которая принадлежит некоммерческой организации EleutherAI. Она не получила разрешение на использование видео с YouTube для сбора данных, но все равно это сделала.   Apple использовала Pile для обучения модели OpenELM, представленной в апреле этого года, и для Apple Intelligence.     #новости
iPhones.ru
iPhones.ru
Apple без разрешения использовала видео с YouTube для обучения своего ИИ Apple Intelligence. То же самое делали Anthropic, Nvidia и Salesforce. Технологические компании обучали искусственный интеллект на субтитрах, полученных из 170 тысяч видео. Среди каналов фигурируют MrBeast, MKBHD, ABC News, BBC, The New York Times, The Verge и Vox. Компании использовали коллекцию материалов под названием Pile, которая принадлежит некоммерческой организации EleutherAI. Она не получила разрешение на использование видео с YouTube для сбора данных, но все равно это сделала. Apple использовала Pile для обучения модели OpenELM, представленной в апреле этого года, и для Apple Intelligence. #новости
Чёрный Треугольник
Чёрный Треугольник
​​Корпорации обучеют ИИ на видео YouTube без разрешения 170,000 видео с YouTube были использованы без разрешения для обучения систем ИИ таких крупных технологических компаний, как Apple, Anthropic, Nvidia и Salesforce. Датасет, известный как "YouTube Subtitles", включает субтитры более чем с 48,000 каналов YouTube, в том числе популярных авторов и новостных агентств. Этот скандал привлёк внимание к недостаточной прозрачности среди компаний, разрабатывающих ИИ, относительно источников их данных. Генеральный директор YouTube Нил Мохан и генеральный директор Google Сундар Пичаи заявили, что использование контента YouTube для обучения систем ИИ без разрешения нарушает условия обслуживания YouTube.
Apple использовала для обучения ИИ данные с YouTube без разрешения авторов  Согласно расследованию Proof News, несколько технологических гигантов, включая Apple, Anthropic, Nvidia и Salesforce, обучали свои ИИ-модели на видео с YouTube без согласия Google и авторов видео.  Нарушителем авторских прав оказалась некоммерческая организация EleutherAI, выпустившая массив данных Pile с субтитрами 173 536 видеороликов более 48 000 каналов YouTube.   Компании признались в использовании Pile для обучения ИИ, в том числе Apple, которая использовала его для моделей OpenELM. Инцидент подчеркивает юридическую неопределенность в сфере обучения ИИ.  Мы из будущего
Мы из будущего
Мы из будущего
Apple использовала для обучения ИИ данные с YouTube без разрешения авторов Согласно расследованию Proof News, несколько технологических гигантов, включая Apple, Anthropic, Nvidia и Salesforce, обучали свои ИИ-модели на видео с YouTube без согласия Google и авторов видео. Нарушителем авторских прав оказалась некоммерческая организация EleutherAI, выпустившая массив данных Pile с субтитрами 173 536 видеороликов более 48 000 каналов YouTube. Компании признались в использовании Pile для обучения ИИ, в том числе Apple, которая использовала его для моделей OpenELM. Инцидент подчеркивает юридическую неопределенность в сфере обучения ИИ. Мы из будущего
170 тыс. видео YouTube для обучения моделей ИИ без спроса вязли Apple, Nvidia и Anthropic  Компании в сфере искусственного интеллекта вновь оказались в центре скандала, касающегося интеллектуальной собственности. Разработчики ИИ-сервисов использовали субтитры к тысячам YouTube-видео для обучения своих моделей искусственного интеллекта без разрешения авторов.  Речь идёт только о субтитрах, без видеоряда или звука. Apple использовала это для обучения Apple Intelligence и модели OpenELM, которую представила в апреле этого года.  Права на сборку датасета принадлежат некоммерческой организации EleutherAI. Proof News утверждает, что организация не получала разрешения на использование видео с YouTube для сбора данных, при этом сам датасет «доступен любому, у кого есть интернет».
Apple* Android * Mi
Apple* Android * Mi
170 тыс. видео YouTube для обучения моделей ИИ без спроса вязли Apple, Nvidia и Anthropic Компании в сфере искусственного интеллекта вновь оказались в центре скандала, касающегося интеллектуальной собственности. Разработчики ИИ-сервисов использовали субтитры к тысячам YouTube-видео для обучения своих моделей искусственного интеллекта без разрешения авторов. Речь идёт только о субтитрах, без видеоряда или звука. Apple использовала это для обучения Apple Intelligence и модели OpenELM, которую представила в апреле этого года. Права на сборку датасета принадлежат некоммерческой организации EleutherAI. Proof News утверждает, что организация не получала разрешения на использование видео с YouTube для сбора данных, при этом сам датасет «доступен любому, у кого есть интернет».
Apple отрицает, что использовала видео с YouTube для обучения Apple Intelligence.  По словам компании, она действительно использовала ролики для обучения модели OpenELM с открытым исходным кодом, но она не лежит в основе Apple Intelligence. OpenELM была создана только для исследовательских целей.     #новости
iPhones.ru
iPhones.ru
Apple отрицает, что использовала видео с YouTube для обучения Apple Intelligence. По словам компании, она действительно использовала ролики для обучения модели OpenELM с открытым исходным кодом, но она не лежит в основе Apple Intelligence. OpenELM была создана только для исследовательских целей. #новости
Loading indicator gif
Apple использовала видеоролики с YouTube для обучения своей нейросети. Это вообще незаконно  Согласно исследованию Proof News, опубликованному совместно с Wired, несколько крупных компаний, среди которых Apple, Nvidia и Salesforce, использовали датсет из более 170 000 видеороликов с YouTube для обучения систем искусственного интеллекта.  В частности компании использовали субтитры к роликам на YouTube, причём без каких-либо разрешений. Датасет охватывает видео с 48 000 каналов, но изображения из роликов в него не входят. Например, в набор данных вошли видео MrBeast и Маркса Браунли, а также клипы крупнейших новостных агентств, включая The Verge и сети Vox.  В рамках своего расследования Proof News также выпустила интерактивный инструмент поиска YouTube-каналов в датасете, которым может воспользоваться каждый.  Представители YouTube пока не ответили на запросы медиа.
iGuides.ru
iGuides.ru
Apple использовала видеоролики с YouTube для обучения своей нейросети. Это вообще незаконно Согласно исследованию Proof News, опубликованному совместно с Wired, несколько крупных компаний, среди которых Apple, Nvidia и Salesforce, использовали датсет из более 170 000 видеороликов с YouTube для обучения систем искусственного интеллекта. В частности компании использовали субтитры к роликам на YouTube, причём без каких-либо разрешений. Датасет охватывает видео с 48 000 каналов, но изображения из роликов в него не входят. Например, в набор данных вошли видео MrBeast и Маркса Браунли, а также клипы крупнейших новостных агентств, включая The Verge и сети Vox. В рамках своего расследования Proof News также выпустила интерактивный инструмент поиска YouTube-каналов в датасете, которым может воспользоваться каждый. Представители YouTube пока не ответили на запросы медиа.
Более 170 000 видео с YouTube вошли в огромный датасет для обучения ИИ систем, как выяснили Proof News и Wired. Компании Apple, Anthropic, Nvidia и Salesforce использовали субтитры, взятые с платформы без разрешения. Датасет включает субтитры из видео с более чем 48 000 каналов, включая популярные ролики от MrBeast и Marques Brownlee, но также были использованы новости. Marques Brownlee подтвердил, что Apple использовала данные с его видео, и отметил, что это проблема будет актуальной долгое время. YouTube пока не прокомментировал ситуацию. Proof News создали интерактивный инструмент, позволяющий проверить, какие видео попали в датасет. Этот случай вновь поднимает вопрос прозрачности использования данных для обучения ИИ.
Сейчас
Сейчас
Более 170 000 видео с YouTube вошли в огромный датасет для обучения ИИ систем, как выяснили Proof News и Wired. Компании Apple, Anthropic, Nvidia и Salesforce использовали субтитры, взятые с платформы без разрешения. Датасет включает субтитры из видео с более чем 48 000 каналов, включая популярные ролики от MrBeast и Marques Brownlee, но также были использованы новости. Marques Brownlee подтвердил, что Apple использовала данные с его видео, и отметил, что это проблема будет актуальной долгое время. YouTube пока не прокомментировал ситуацию. Proof News создали интерактивный инструмент, позволяющий проверить, какие видео попали в датасет. Этот случай вновь поднимает вопрос прозрачности использования данных для обучения ИИ.
Chip. Гаджеты и технологии
Chip. Гаджеты и технологии
‍#CHIP_новости Apple и NVIDIA тренировали свои нейросети на видеороликах с YouTube База данных для обучения ИИ охватывает 48 000 каналов. Подробнее здесь
Apple, Nvidia и Anthropic обучали свой ИИ на контенте самых популярных ютуберов — и им за это ничего не будет  Компании кормили свои нейросети расшифровками видео Маркиза Браунли  MKBHD , MrBeast, PewDiePie, но, кажется, даже не подозревали, что нарушают чьи-то права  Дело было так: есть некая некоммерческая EleutherAI делает сторонние субтитры для YouTube-роликов, а затем собирает их в датасеты для обучения ИИ. В самом крупном лежит текстовая расшифровка до 180к видео самых разных каналов, в тч перечисленных звёзд хостинга. Собственно, ей и пользовались Apple с другими корпорациями... Также как и десятки других энтузиастов, ведь материалы открытые. Получается, единственный, кто нарушил чьи-то права — это вот эта контора, и наказать её может YouTube.
Двоичный кот
Двоичный кот
Apple, Nvidia и Anthropic обучали свой ИИ на контенте самых популярных ютуберов — и им за это ничего не будет Компании кормили свои нейросети расшифровками видео Маркиза Браунли MKBHD , MrBeast, PewDiePie, но, кажется, даже не подозревали, что нарушают чьи-то права Дело было так: есть некая некоммерческая EleutherAI делает сторонние субтитры для YouTube-роликов, а затем собирает их в датасеты для обучения ИИ. В самом крупном лежит текстовая расшифровка до 180к видео самых разных каналов, в тч перечисленных звёзд хостинга. Собственно, ей и пользовались Apple с другими корпорациями... Также как и десятки других энтузиастов, ведь материалы открытые. Получается, единственный, кто нарушил чьи-то права — это вот эта контора, и наказать её может YouTube.
‍  Аналитики насчитали тысячи YouTube-роликов, на основе которых крупные компании обучают ИИ без ведома авторов  Среди причастных — NVIDIA и Apple. Расследование помогло найти 173,5к видео с 48к каналов — и это только те, что были указаны в публикациях компаний.   Из роликов были взяты субтитры — для того, чтобы научить нейросети естественным для человека построению предложений и ходу мыслей.  Удивляемся?
VGTimes
VGTimes
‍ Аналитики насчитали тысячи YouTube-роликов, на основе которых крупные компании обучают ИИ без ведома авторов Среди причастных — NVIDIA и Apple. Расследование помогло найти 173,5к видео с 48к каналов — и это только те, что были указаны в публикациях компаний. Из роликов были взяты субтитры — для того, чтобы научить нейросети естественным для человека построению предложений и ходу мыслей. Удивляемся?
Loading indicator gif