DeepSeek-R2 выйдет в конце августа: Китай стремится к независимости в сфере ИИ
Китайская компания DeepSeek готовится к запуску своей новой крупной языковой модели DeepSeek-R2 в период с 15 по 30 августа 2025 года.
Ожидается, что DeepSeek-R2 совершит значительный скачок в архитектуре, перейдя на более продвинутую систему Mixture of Experts (MoE). Модель также получит более умную систему маршрутизации для эффективной обработки сложных вычислительных задач. По данным источников, знакомых с разработкой, модель может масштабироваться до 1,2 триллиона параметров — почти вдвое больше, чем у DeepSeek-R1 (671 миллиард). Однако это всё ещё меньше, чем у ChatGPT-4/5, который насчитывает свыше 1,8 триллиона параметров.
Китай стремится к независимости в сфере ИИ
В рамках стратегии по достижению технологического суверенитета модель полностью обучалась на чипах Huawei Ascend 910B. Вычислительный кластер Huawei, обеспечивающий производительность 512 PFLOPS (FP16) при 82% загрузке, демонстрирует 91% от производительности кластера на базе чипов Nvidia A100. Аналитики считают это важным шагом к снижению зависимости Китая от американских решений для ИИ.
Благодаря использованию локального оборудования и оптимизации, обучение DeepSeek-R2 обошлось на 97% дешевле, чем GPT-4. Ожидается, что DeepSeek предложит более доступные API-тарифы, что может изменить текущую ценовую политику, доминируемую OpenAI и Anthropic.
Ожидание релиза DeepSeek-R2 уже повлияло на китайские технологические акции. Производитель ИИ-чипов Cambricon подорожал на 20%, а его капитализация превысила 355 миллиардов юаней (~3,55 триллиона рублей).
Параллельно Huawei представила новый фреймворк для ускорения вывода ИИ-моделей — Unified Cache Manager (UCM). В тестах с China UnionPay он сократил задержки на 90% и увеличил пропускную способность в 22 раза. Компания планирует открыть исходный код UCM в сентябре.
Запуск DeepSeek-R2 и выход фреймворка UCM демонстрируют серьёзные амбиции Китая в сфере ИИ. Эти разработки приближают эпоху, когда Китай сможет создавать и использовать высокопроизводительные ИИ-системы без зависимости от западных технологий.
0 комментариев