Nvidia обвиняют в санкционировании использования пиратских книг для обучения ИИ

Возможности современных ИИ-моделей, таких как GPT-5, Gemini, Claude и Grok, напрямую зависят от объёма и разнообразия данных, на которых они обучаются. Однако этот процесс всё чаще становится предметом судебных разбирательств, где компании обвиняют в использовании данных без соответствующих прав. В расширенном коллективном иске против Nvidia обвинения звучат ещё серьёзнее: утверждается, что гигант по производству графических процессоров намеренно использовал нелегальный источник пиратских книг для обучения своих моделей.

Как сообщает TorrentFreak, в дополненной жалобе, поданной в окружной суд Окленда (Калифорния) на прошлой неделе, утверждается, что сотрудники Nvidia выходили на связь с так называемой «теневой библиотекой» Anna's Archive — репозиторием пиратских книг и документов.

Истцы ссылаются на внутреннюю переписку Nvidia в качестве доказательства. В поданном документе, предположительно, кто-то из команды по стратегии данных Nvidia пишет: «Мы изучаем возможность включения Anna's Archive в данные для предварительного обучения наших LLM (больших языковых моделей)».

Далее следует: «Мы решаем внутри компании, готовы ли мы пойти на риск использования этих данных, но хотели бы поговорить с вашей командой, чтобы лучше понять связанную с LLM работу, которую вы проделали».

Хотя Anna's Archive, по всей видимости, сама не размещает контент напрямую, она действует как «поисковая система» для предполагаемых пиратских библиотек. Эти сторонние хосты предоставляют доступ не только к материалам, защищённым авторским правом, но именно за такой контент они наиболее печально известны.

Первоначальный иск против Nvidia был подан ещё в 2024 году. Как тогда сообщал TorrentFreak, ответ Nvidia сводился к тому, что обучение ИИ на таком материале — это не то же самое, что владение нелегально полученной книгой или даже её использование человеком. Компания заявила, что «обучение измеряет статистические корреляции в совокупности, по огромному массиву данных, и кодирует их в параметры модели». По сути, Nvidia утверждает, что использование таких наборов данных подпадает под доктрину добросовестного использования (fair use).

Подобные иски ранее подавались против Anthropic и Meta. В случае с Anthropic судья постановил, что, хотя доступ к данным действительно может считаться добросовестным использованием, у компании «не было права использовать пиратские копии для своей центральной библиотеки». Чем закончится дело против Nvidia, покажет время.

Этот иск является частью более широкой правовой битвы вокруг этики и законности сбора данных для обучения ИИ. Многие авторы и правообладатели выступают против использования их произведений без разрешения и компенсации, утверждая, что это подрывает творческие индустрии. В то же время технологические компании настаивают, что такой анализ данных необходим для прогресса и носит трансформативный характер. Исход подобных дел может установить важные юридические прецеденты для будущего развития искусственного интеллекта.

* Meta, Facebook и Instagram запрещены в России.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии