DeepSeek: китайский ИИ-чатбот, который взбудоражил мир
Китайская лаборатория искусственного интеллекта DeepSeek привлекла внимание мирового сообщества после того, как ее приложение с чат-ботом возглавило рейтинги Apple App Store и Google Play. Эффективные методы обучения ИИ-моделей DeepSeek заставили аналитиков Уолл-стрит и технологических экспертов усомниться в способности США сохранить лидерство в гонке ИИ и в устойчивости спроса на ИИ-чипы.
Происхождение из финансового мира
DeepSeek поддерживается компанией High-Flyer Capital Management — китайским количественным хедж-фондом, использующим ИИ для торговых решений. Сооснователь фонда Лян Вэньфэн запустил High-Flyer Capital Management в 2019 году, а в 2023 году создал DeepSeek как отдельную лабораторию для исследований ИИ.
Компания с первого дня строила собственные центры обработки данных для обучения моделей. Однако, как и другие китайские ИИ-компании, DeepSeek столкнулась с ограничениями экспорта аппаратного обеспечения из США. Для обучения одной из последних моделей компании пришлось использовать чипы Nvidia H800 — менее мощную версию чипа H100, доступного американским компаниям.
Мощные модели
DeepSeek представила свои первые модели в ноябре 2023 года, но настоящий прорыв произошел весной 2024 года с выпуском семейства моделей DeepSeek-V2. Эта система анализа текста и изображений показала отличные результаты в различных тестах ИИ и оказалась значительно дешевле в эксплуатации, чем конкурирующие модели.
В декабре 2024 года DeepSeek запустила модель V3, которая, по внутренним тестам компании, превосходит как открытые модели Meta Llama, так и закрытые модели вроде GPT-4o от OpenAI.
Не менее впечатляющей стала модель R1 для «рассуждений», выпущенная в январе 2025 года. DeepSeek утверждает, что R1 работает так же хорошо, как модель o1 от OpenAI в ключевых тестах. Модели рассуждений проверяют сами себя, что помогает избежать типичных ошибок, хотя и работают медленнее обычных моделей.
Однако у китайских ИИ-моделей есть ограничения — они проходят проверку интернет-регулятора Китая, чтобы гарантировать, что их ответы «воплощают основные социалистические ценности». Например, R1 не отвечает на вопросы о площади Тяньаньмэнь или автономии Тайваня.
Достижения и ограничения
В марте 2025 года DeepSeek превысила 16,5 миллионов посещений, заняв второе место по популярности, хотя и уступая ChatGPT с его 500 миллионами еженедельных активных пользователей.
Успех DeepSeek против более крупных конкурентов был охарактеризован как «переворачивающий ИИ-индустрию». Успех компании стал одной из причин падения акций Nvidia на 18% в январе и вызвал публичную реакцию генерального директора OpenAI Сэма Альтмана.
В марте 2025 года Министерство торговли США запретило использование DeepSeek на государственных устройствах. Microsoft объявила о доступности DeepSeek в своем сервисе Azure AI Foundry, но при этом вице-председатель Microsoft Брэд Смит заявил, что сотрудникам компании запрещено использовать DeepSeek из-за проблем с безопасностью данных и пропагандой.
Генеральный директор Nvidia Дженсен Хуанг подчеркнул «отличные инновации» DeepSeek, отметив, что такие модели «рассуждений» выгодны для Nvidia, поскольку требуют значительно больше вычислительных мощностей.
0 комментариев