Huawei Atlas 350: производительность в 2,87 раза выше NVIDIA H20 и поддержка DeepSeek V4
Сегодня DeepSeek выпустила предварительную версию новой модели V4 и одновременно открыла исходный код.
Компания Huawei сразу же заявила, что линейка суперузлов Ascend полностью поддерживает DeepSeek V4.
По словам Huawei, Ascend всегда синхронно поддерживал серию моделей DeepSeek, и благодаря тесному сотрудничеству в области чипов и моделей вся линейка суперузлов Ascend теперь поддерживает модели DeepSeek V4.
В анонсе DeepSeek также сообщается: «Ожидается, что после массового выпуска и развёртывания суперузла Ascend 950 во второй половине года цена на версию Pro будет значительно снижена».
Ранее на Huawei China Partner Conference 2026 компания представила и продемонстрировала ускоритель Atlas 350 на базе процессора Ascend 950PR (Ascend 950PR) для AI-тренировок и инференса.
По сравнению с предыдущим поколением чипов Ascend, Ascend 950PR значительно улучшил низкоточные форматы данных, векторные вычисления, межсоединения и собственную HBM-память.
Как рассказал президент бизнеса Ascend Computing компании Huawei Чжан Дисюань, производительность одиночной карты Atlas 350 достигает 2,87x от NVIDIA H20, и это единственный продукт для инференса в Китае, поддерживающий FP4-точность.
Кроме того, объём HBM (высокопроизводительной памяти) этого чипа составляет 112 ГБ, что в 1,16 раза больше, чем у H20; скорость генерации мультимодального контента увеличена на 60%; гранулярность доступа к памяти уменьшена с 512 байт до 128 байт, что повышает эффективность доступа для малых операторов в 4 раза.
На стенде Atlas 350 на выставке были опубликованы параметры: производительность Atlas 350 в точности FP4 составляет 1,56 PFLOPS, пропускная способность – 1,4 ТБ/с, энергопотребление – 600 Вт (в 1,5 раза больше, чем у H20).
Atlas 350 поддерживает FP16, FP8, а также более низкую точность FP4. Это означает, что серверы с платами Atlas 350 способны обслуживать более крупные модели с меньшей задержкой инференса: чем ниже точность, тем выше скорость вычислений и эффективность использования регистров.
Чжан Дисюань отметил, что на основе Atlas 350 и других продуктов, с учётом тенденций развития ИИ и потребностей клиентов, Ascend сформирует три основных сценария вычислений – крупный, средний и малый, чтобы помочь партнёрам удовлетворять различные потребности и совместно развивать интеллектуализацию отраслей.








0 комментариев