DeepSeek-R2 выйдет в конце августа: Китай стремится к независимости в сфере ИИ

13 августа 2025, 14:34 / Технологии → Новости / Технологии

Китайская компания DeepSeek готовится к запуску своей новой крупной языковой модели DeepSeek-R2 в период с 15 по 30 августа 2025 года.

Ожидается, что DeepSeek-R2 совершит значительный скачок в архитектуре, перейдя на более продвинутую систему Mixture of Experts (MoE). Модель также получит более умную систему маршрутизации для эффективной обработки сложных вычислительных задач. По данным источников, знакомых с разработкой, модель может масштабироваться до 1,2 триллиона параметров — почти вдвое больше, чем у DeepSeek-R1 (671 миллиард). Однако это всё ещё меньше, чем у ChatGPT-4/5, который насчитывает свыше 1,8 триллиона параметров.

Китай стремится к независимости в сфере ИИ

В рамках стратегии по достижению технологического суверенитета модель полностью обучалась на чипах Huawei Ascend 910B. Вычислительный кластер Huawei, обеспечивающий производительность 512 PFLOPS (FP16) при 82% загрузке, демонстрирует 91% от производительности кластера на базе чипов Nvidia A100. Аналитики считают это важным шагом к снижению зависимости Китая от американских решений для ИИ.

Благодаря использованию локального оборудования и оптимизации, обучение DeepSeek-R2 обошлось на 97% дешевле, чем GPT-4. Ожидается, что DeepSeek предложит более доступные API-тарифы, что может изменить текущую ценовую политику, доминируемую OpenAI и Anthropic.

Ожидание релиза DeepSeek-R2 уже повлияло на китайские технологические акции. Производитель ИИ-чипов Cambricon подорожал на 20%, а его капитализация превысила 355 миллиардов юаней (~3,55 триллиона рублей).

Параллельно Huawei представила новый фреймворк для ускорения вывода ИИ-моделей — Unified Cache Manager (UCM). В тестах с China UnionPay он сократил задержки на 90% и увеличил пропускную способность в 22 раза. Компания планирует открыть исходный код UCM в сентябре.

Запуск DeepSeek-R2 и выход фреймворка UCM демонстрируют серьёзные амбиции Китая в сфере ИИ. Эти разработки приближают эпоху, когда Китай сможет создавать и использовать высокопроизводительные ИИ-системы без зависимости от западных технологий.

2 комментария

О чем все это

Анон
14 августа 2025, 09:19
Ответить
↓

Статья рассказывает о запуске новой китайской ИИ-модели DeepSeek-R2 в конце августа 2025 года. Это важный шаг Китая к технологической независимости — модель обучалась на китайских чипах Huawei и обещает быть дешевле западных аналогов вроде GPT-4.
Ключевые моменты: масштабируемость до 1,2 трлн параметров, использование фреймворка UCM для ускорения ИИ и рост акций китайских tech-компаний.

AI Rutab
14 августа 2025, 09:20
Ответить
↑
↓

DeepSeek-R2 выйдет в конце августа: Китай стремится к независимости в сфере ИИ

Китай стремится к независимости в сфере ИИ

Новое ⚡

2 комментария

Оставить комментарий

Все комментарии - Технологии