DeepSeek: китайский ИИ-чатбот, который взбудоражил мир

Китайская лаборатория искусственного интеллекта DeepSeek привлекла внимание мирового сообщества после того, как ее приложение с чат-ботом возглавило рейтинги Apple App Store и Google Play. Эффективные методы обучения ИИ-моделей DeepSeek заставили аналитиков Уолл-стрит и технологических экспертов усомниться в способности США сохранить лидерство в гонке ИИ и в устойчивости спроса на ИИ-чипы.

Происхождение из финансового мира

DeepSeek поддерживается компанией High-Flyer Capital Management — китайским количественным хедж-фондом, использующим ИИ для торговых решений. Сооснователь фонда Лян Вэньфэн запустил High-Flyer Capital Management в 2019 году, а в 2023 году создал DeepSeek как отдельную лабораторию для исследований ИИ.

Компания с первого дня строила собственные центры обработки данных для обучения моделей. Однако, как и другие китайские ИИ-компании, DeepSeek столкнулась с ограничениями экспорта аппаратного обеспечения из США. Для обучения одной из последних моделей компании пришлось использовать чипы Nvidia H800 — менее мощную версию чипа H100, доступного американским компаниям.

Мощные модели

DeepSeek представила свои первые модели в ноябре 2023 года, но настоящий прорыв произошел весной 2024 года с выпуском семейства моделей DeepSeek-V2. Эта система анализа текста и изображений показала отличные результаты в различных тестах ИИ и оказалась значительно дешевле в эксплуатации, чем конкурирующие модели.

В декабре 2024 года DeepSeek запустила модель V3, которая, по внутренним тестам компании, превосходит как открытые модели Meta Llama, так и закрытые модели вроде GPT-4o от OpenAI.

Не менее впечатляющей стала модель R1 для «рассуждений», выпущенная в январе 2025 года. DeepSeek утверждает, что R1 работает так же хорошо, как модель o1 от OpenAI в ключевых тестах. Модели рассуждений проверяют сами себя, что помогает избежать типичных ошибок, хотя и работают медленнее обычных моделей.

Однако у китайских ИИ-моделей есть ограничения — они проходят проверку интернет-регулятора Китая, чтобы гарантировать, что их ответы «воплощают основные социалистические ценности». Например, R1 не отвечает на вопросы о площади Тяньаньмэнь или автономии Тайваня.

Достижения и ограничения

В марте 2025 года DeepSeek превысила 16,5 миллионов посещений, заняв второе место по популярности, хотя и уступая ChatGPT с его 500 миллионами еженедельных активных пользователей.

Успех DeepSeek против более крупных конкурентов был охарактеризован как «переворачивающий ИИ-индустрию». Успех компании стал одной из причин падения акций Nvidia на 18% в январе и вызвал публичную реакцию генерального директора OpenAI Сэма Альтмана.

В марте 2025 года Министерство торговли США запретило использование DeepSeek на государственных устройствах. Microsoft объявила о доступности DeepSeek в своем сервисе Azure AI Foundry, но при этом вице-председатель Microsoft Брэд Смит заявил, что сотрудникам компании запрещено использовать DeepSeek из-за проблем с безопасностью данных и пропагандой.

Генеральный директор Nvidia Дженсен Хуанг подчеркнул «отличные инновации» DeepSeek, отметив, что такие модели «рассуждений» выгодны для Nvidia, поскольку требуют значительно больше вычислительных мощностей.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Все комментарии - Технологии