Nvidia отрицает использование пиратских книг для обучения своих ИИ-моделей
Компания Nvidia отвергает утверждения о том, что она обучала свои модели искусственного интеллекта на пиратских книгах, заявив федеральному суду в Калифорнии, что её предполагаемый контакт с «библиотекой» «Anna’s Archive» не является доказательством нарушения авторских прав.
В ходатайстве об отклонении иска, поданном 29 января, компания утверждает, что авторы, стоящие за делом Nazemian v Nvidia, не смогли правдоподобно показать, что их конкретные произведения были загружены или использованы для обучения, несмотря на расширение жалобы новыми теориями и наборами данных.
Дело Nazemian было подано в начале 2024 года и рассматривается в Северном округе Калифорнии судьёй Джоном Тигаром. Оно касается утверждений, что инструменты и референсные модели ИИ от Nvidia обучались на защищённых авторским правом книгах из так называемых теневых библиотек, включая Anna's Archive и Books3. Дополненная жалоба истцов ссылается на внутренние обсуждения, в ходе которых сотрудники Nvidia якобы искали подтверждение доступа к Anna’s Archive, утверждая, что это является доказательством незаконного использования.
В своём ходатайстве Nvidia заявляет, что дополненная жалоба не содержит даже самых основных элементов, необходимых для иска о нарушении авторских прав. Согласно документу, истцы
«не приводят фактов, показывающих, что Nvidia скопировала какие-либо из их охраняемых авторским правом произведений, когда такое копирование произошло или какие именно модели Nvidia предположительно содержат эти произведения».Компания утверждает, что без этих деталей претензии являются чисто спекулятивными.
Касаясь непосредственно обвинений, связанных с Anna’s Archive, Nvidia заявляет, что, хотя жалоба описывает внутренние обсуждения и запросы о возможном доступе к сайту, в ней не утверждается, что Nvidia фактически получила или загрузила какие-либо произведения истцов оттуда. В ходатайстве далее утверждается, что обсуждение или оценка возможных источников данных не равнозначна копированию материалов, защищённых авторским правом, и что закон об авторском праве требует от истцов изложения фактов, показывающих воспроизведение охраняемых произведений.
«С равной долей вероятности можно предположить, что Nvidia этого не делала [не получала произведения истцов]».
Nvidia также критикует опору истцов на утверждения, сделанные
«по информации и убеждению»,заявляя, что такой подход ненадлежащим образом пытается использовать досудебное раскрытие доказательств в качестве замены изложению фактов. Компания напоминает суду, что истцы по делам об авторском праве должны заявлять о нарушении до начала раскрытия доказательств, а не полагаться на него, чтобы определить, имело ли место нарушение, что, по-видимому, пытается сделать Anna’s Archive в данном случае.
Помимо Anna’s Archive, Nvidia стремится сузить рамки дела, оспаривая включение дополнительных наборов данных и моделей, таких как Megatron 345M, добавленных в дополненную жалобу, утверждая, что истцы неправомерно объединяют несколько моделей и инструментов, не объясняя, как какая-либо конкретная модель обучалась на их произведениях. В нескольких случаях Nvidia указывает на свою собственную публичную документацию, чтобы доказать, что предположения истцов о данных для обучения противоречат общедоступным источникам.
Дополненная жалоба также вводит теорию вторичной ответственности, связанную с фреймворком Nvidia NeMo Megatron и его поддержкой загрузки больших публичных наборов данных, таких как The Pile. Nvidia отвечает, что в жалобе не утверждается о совершении какого-либо третьим лицом основного акта прямого нарушения, что необходимо для поддержания исков о пособничестве или косвенном нарушении авторских прав. Предоставление опциональных инструментов, утверждает компания, не устанавливает ответственность при отсутствии конкретных утверждений о том, что пользователи нарушали авторские права с помощью этих инструментов.
Слушания по ходатайству об отклонении иска назначены в Окружном суде США Северного округа Калифорнии на 2 апреля 2026 года.
ИИ: Этот судебный процесс является частью масштабной правовой битвы вокруг обучения ИИ на данных из интернета. Позиция Nvidia, требующая от истцов предоставления конкретных доказательств копирования, а не просто контакта с источником, может стать важным прецедентом для всей индустрии. Если суд согласится с аргументами компании, это усложнит будущие коллективные иски авторов против технологических гигантов.







0 комментариев