Huawei Atlas 350: производительность в 2,87 раза выше NVIDIA H20 и поддержка DeepSeek V4

24 апреля 2026, 08:35 / Технологии → Новости / Технологии

Сегодня DeepSeek выпустила предварительную версию новой модели V4 и одновременно открыла исходный код.

Компания Huawei сразу же заявила, что линейка суперузлов Ascend полностью поддерживает DeepSeek V4.

По словам Huawei, Ascend всегда синхронно поддерживал серию моделей DeepSeek, и благодаря тесному сотрудничеству в области чипов и моделей вся линейка суперузлов Ascend теперь поддерживает модели DeepSeek V4.

В анонсе DeepSeek также сообщается: «Ожидается, что после массового выпуска и развёртывания суперузла Ascend 950 во второй половине года цена на версию Pro будет значительно снижена».

Ранее на Huawei China Partner Conference 2026 компания представила и продемонстрировала ускоритель Atlas 350 на базе процессора Ascend 950PR (Ascend 950PR) для AI-тренировок и инференса.

По сравнению с предыдущим поколением чипов Ascend, Ascend 950PR значительно улучшил низкоточные форматы данных, векторные вычисления, межсоединения и собственную HBM-память.

Как рассказал президент бизнеса Ascend Computing компании Huawei Чжан Дисюань, производительность одиночной карты Atlas 350 достигает 2,87x от NVIDIA H20, и это единственный продукт для инференса в Китае, поддерживающий FP4-точность.

Кроме того, объём HBM (высокопроизводительной памяти) этого чипа составляет 112 ГБ, что в 1,16 раза больше, чем у H20; скорость генерации мультимодального контента увеличена на 60%; гранулярность доступа к памяти уменьшена с 512 байт до 128 байт, что повышает эффективность доступа для малых операторов в 4 раза.

На стенде Atlas 350 на выставке были опубликованы параметры: производительность Atlas 350 в точности FP4 составляет 1,56 PFLOPS, пропускная способность – 1,4 ТБ/с, энергопотребление – 600 Вт (в 1,5 раза больше, чем у H20).

Atlas 350 поддерживает FP16, FP8, а также более низкую точность FP4. Это означает, что серверы с платами Atlas 350 способны обслуживать более крупные модели с меньшей задержкой инференса: чем ниже точность, тем выше скорость вычислений и эффективность использования регистров.

Чжан Дисюань отметил, что на основе Atlas 350 и других продуктов, с учётом тенденций развития ИИ и потребностей клиентов, Ascend сформирует три основных сценария вычислений – крупный, средний и малый, чтобы помочь партнёрам удовлетворять различные потребности и совместно развивать интеллектуализацию отраслей.