Система Huawei CloudMatrix 384 превосходит NVIDIA GB200 NVL72

Huawei анонсировала свой системный суперузел CloudMatrix 384, который компания рекламирует как собственную отечественную альтернативу системе NVIDIA GB200 NVL72, с более высокой общей производительностью системы, но худшей производительностью на чип и более высоким энергопотреблением. В то время как GB200 NVL72 от NVIDIA использует 36 процессоров Grace в паре с 72 графическими процессорами GB200 "Blackwell", система Huawei CloudMatrix 384 использует 384 ускорителя Huawei Ascend 910C, чтобы превзойти систему NVIDIA GB200 NVL72. Требуется примерно в пять раз больше ускорителей Ascend 910C, чтобы обеспечить почти вдвое большую производительность системы GB200 NVL, что не очень хорошо с точки зрения смещения на ускоритель, но отлично на уровне развертывания на систему. SemiAnalysis утверждает, что Huawei отстает на поколение по производительности чипа, но опережает NVIDIA в проектировании и развертывании масштабируемых систем.

Если рассматривать отдельные чипы, то NVIDIA GB200 NVL72 явно превосходит Huawei Ascend 910C, обеспечивая более чем в три раза большую производительность BF16 (2500 ТераФЛОПС против 780 ТераФЛОПС), больше памяти на чипе (192 ГБ против 128 ГБ) и более высокую пропускную способность (8 ТБ/с против 3,2 ТБ/с). Другими словами, NVIDIA имеет преимущество в чистой мощности и эффективности на уровне чипа. Но переключите переключатель на системный уровень, и CloudMatrix CM384 от Huawei выйдет вперед. Он выдает в 1,7 раза больше петафлопсов, вмещает в 3,6 раза больше общей емкости HBM и поддерживает более чем в пять раз больше графических процессоров и соответствующей пропускной способности кластера NVIDIA NVL72. Однако эта масштабируемость имеет свои недостатки, поскольку установка Huawei потребляет почти в четыре раза больше общей мощности. Один GB200 NVL72 потребляет 145 кВт мощности, в то время как один Huawei CloudMatrix 384 потребляет ~560 кВт. Таким образом, NVIDIA — ваш выбор, если вам нужна максимальная эффективность в одном GPU. Если вы создаете огромный суперкластер ИИ, где общая пропускная способность и скорость межсоединений имеют наибольшее значение, решение Huawei на самом деле имеет большой смысл. Благодаря своей топологии «все ко всем» Huawei предоставила систему обучения и вывода ИИ, которую стоит приобрести. Когда SMIC, производитель чипов Huawei, получит более продвинутый производственный узел, эффективность этих систем также возрастет.

Источник: SemiAnalysis

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Можно делать смартфоны и планшеты на этом процессоре и наконец то использовать полноценную windows. Это отличная замена процессорам arm
  • Анон
Странно почему не 50 долларов.
  • Анон
Понимаю мощь производительность и все дела, но как черт возьми тепло отделять от камня если его прям нагрузить
  • Анон
Не предвзятость это - "Интересно, что Arc B580 проигрывает RTX 4060 в OpenCL" - где разница на невероятных 3,5 %, "но реабилитируется с НЕЗНАЧИТЕЛЬНЫМ 6%-ным преимуществом в Vulkan.". Не...
  • Анон
"Физика вышла из чата"??? Каким образом они добилис свечения точек, которые меньше четверти длины волны???
  • Анон
И теперь нельзя отключить авто обновление!!! Это жесть
  • Анон
Не знаю, я купил Cougar850 80Gold за 10К₽ и нормально
  • Анон
После всех роликов я одно понял у этой игры которую выпустят 20 мая у неё большое будущее
  • Анон
Когда они в продаже появятся? Уже как бы конец февраля, а нигде нет..
  • Анон

Смотреть все