DeepSeek: китайская модель ИИ собирает данные пользователей

28 января 2025, 20:58 / Технологии → Новости / Технологии

Новейшая большая языковая модель R1 от DeepSeek уже приобрела скандальную известность после того, как ее выпуск обрушил акции ИИ

Thumbnail: Искусственный интеллект Иску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

, а разоблачения ее политики конфиденциальности могут вызвать еще большее недоумение — компания собирает обширные данные своих онлайн-пользователей, включая нажатия клавиш, пароли и данные, введенные в запросах, такие как изображения и текст, а затем хранит их на серверах в Китае.

По данным DeepSeek, личная информация, включая дату рождения, адреса электронной почты, номера телефонов и пароли, является честной игрой. Любой контент, который пользователи предоставляют R1 LLM, от текстовых и аудиоподсказок до загруженных файлов, также может быть собран DeepSeek. И всякий раз, когда кто-то связывается с DeepSeek, он заявляет, что может сохранить доказательства личности пользователей, что, предположительно, означает такие документы, как водительские права.

Но это еще не все. DeepSeek записывает все, что связано с оборудованием пользователей: IP-адреса, модели телефонов, язык и т. д. Сбор данных настолько тщательный, что компания отмечает «шаблоны или ритмы нажатия клавиш». Файлы cookie, классический метод отслеживания пользователей в Интернете, также способствуют сбору данных пользователей.

Поскольку R1 имеет «открытый исходный код», его можно запускать где угодно на любом оборудовании, что в целом хорошо для конфиденциальности — запуск модели локально на вашем собственном оборудовании, по-видимому, не приведет к сбору данных. Однако DeepSeek предлагает онлайн-доступ к R1 через свой веб-сайт и мобильное приложение, что означает, что компания ИИ обрабатывает и хранит данные онлайн-пользователей. К счастью, DeepSeek очень прозрачно относится к тому, какие данные она собирает у онлайн-пользователей, где они хранятся и что она с ними делает. Все это подробно описано на веб-странице политики конфиденциальности, где видно, что нет почти ничего, что компания не собирает.

Хотя для компаний с большим объемом пользовательских данных обычной практикой является продажа этих данных заинтересованным компаниям, таким как рекламные фирмы, и DeepSeek заявляет, что может так поступать, компания также признает, что «рекламодатели, специалисты по измерениям и другие партнеры делятся с нами информацией о вас и ваших действиях вне Сервиса, например, о вашей активности на других веб-сайтах и в приложениях или в магазинах, включая продукты или услуги, которые вы приобрели онлайн или лично». Располагая всей этой информацией, DeepSeek, похоже, имеет возможность очень близко знать своих пользователей.

«Корпоративная группа» DeepSeek также имеет доступ к данным, которые она собирает для предоставления «определенных функций, таких как хранение, доставка контента, безопасность, исследования и разработки, аналитика, поддержка клиентов и техническая поддержка, а также модерация контента».

Что касается того, где хранится вся эта информация, политика конфиденциальности гласит, что все это хранится на серверах, расположенных в Китае, что может вызвать серьезные споры. Опасения по поводу того, что личные данные американцев находятся в руках китайского правительства, были ключевым фактором в попытке администрации Байдена запретить TikTok, что повышает вероятность того, что DeepSeek может попасть под аналогичное внимание.

Разработанная китайской компанией DeepSeek, занимающейся ИИ, R1 — это LLM с открытым исходным кодом, которая может похвастаться передовой производительностью при меньшей вычислительной мощности. Имея 671 миллиард параметров, это одна из самых значимых моделей ИИ, и для ее обучения потребовалось всего 2,8 миллиона часов GPU. Llama 3 от Meta

Ме́та — многозначный термин. Википедия

потребовалось 30,8 миллиона часов GPU, или в 11 раз больше.

DeepSeek хвастался этими достижениями более месяца назад, но R1 был запущен 20 января, и последствия были полностью оценены фондовым рынком только вчера. Рынок отреагировал продажей акций компаний ИИ, таких как Nvidia. Хотя внимание к DeepSeek повысило его статус, многие также пересмотрели то, как он справляется с конфиденциальностью пользователей, что является особенно щекотливым вопросом для всего, что связано с ИИ и программным обеспечением, разработанным в Китае.

Конечно, бывший президент Байден пытался отменить запрет TikTok в свои последние дни, а президент Трамп отложил судьбу приложения почти сразу после того, как он был приведен к присяге на второй срок. Таким образом, DeepSeek также может получить некоторую милость при правильных обстоятельствах.

С другой стороны, союзниками президента Трампа являются Марк Цукерберг из Meta и Сэм Альтман из OpenAI, и оба они, вероятно, не очень рады видеть, как R1 LLM обходит их LLM. Кроме того, трудно представить, что DeepSeek произвел хорошее впечатление на президента-республиканца, непреднамеренно вызвав значительное падение цен на акции многих американских технологических компаний.

Источник: Tomshardware.com

DeepSeek: китайская модель ИИ собирает данные пользователей

0 комментариев

Оставить комментарий

Все комментарии - Технологии