AMD представила ускоритель ИИ MI350P с 144 ГБ HBM3E — до 40% быстрее Nvidia H200 NVL

Компания AMD представила новую модель из серии MI350, выполненную в форм-факторе PCIe. Новый ускоритель Instinct MI350P оснащён 128 вычислительными блоками (CU) и 144 ГБ памяти HBM3E. Он разработан как решение для модернизации существующих серверов с воздушным охлаждением, устанавливаемое без доработок.

Изображение: TSMC

MI350P выполнен в виде двухслотовой карты формата 10,5 дюйма с пассивной системой охлаждения, рассчитанной на тепловыделение в 600 Вт (охлаждение обеспечивается вентиляторами корпуса в стоечном сервере). Карта может быть настроена на работу при пониженном энергопотреблении в 450 Вт для совместимости с шасси, имеющими ограничения по тепловыделению или питанию.

Спецификации AMD MI350X и MI355X
Характеристики (ПИКОВЫЕ ТЕОРЕТИЧЕСКИЕ)AMD Instinct MI350P GPUAMD Instinct MI325X GPUAMD INSTINCT MI350X GPUПЛАТФОРМА AMD INSTINCT MI350XAMD INSTINCT MI355X GPUПЛАТФОРМА AMD INSTINCT MI355X
GPUInstinct MI350P PCIeInstinct MI325X OAMInstinct MI350X OAM8 x Instinct MI350X OAMInstinct MI355X OAM8 x Instinct MI355X OAM
Архитектура GPUCDNA 4CDNA 3CDNA 4 CDNA 4 CDNA 4 CDNA 4
Объём выделенной памяти144 ГБ HBM3E256 ГБ HBM3E288 ГБ HBM3E2.3 ТБ HBM3E288 ГБ HBM3E2.3 ТБ HBM3E
Пропускная способность памяти4 ТБ/с6 ТБ/с8 ТБ/с8 ТБ/с на OAM8 ТБ/с8 ТБ/с на OAM
Производительность FP6436 TFLOPsСтрока 4 - Ячейка 2 72 TFLOPs577 TFLOPs78.6 TFLOPS628.8 TFLOPs
Производительность FP162.3 PFLOPS2.61 PFLOPS4.6 PFLOPS36.8 PFLOPS5 PFLOPS40.2 PFLOPS
Производительность FP84.6 PFLOPS5.22 PFLOPS9.2 PFLOPs73.82 PFLOPs10.1 PFLOPs80.5 PFLOPs
Производительность FP6Строка 7 - Ячейка 1 Строка 7 - Ячейка 2 18.45 PFLOPS147.6 PFLOPS20.1 PFLOPS161 PFLOPS
Производительность FP4*Строка 8 - Ячейка 1 Строка 8 - Ячейка 2 18.45 PFLOPS147.6 PFLOPS20.1 PFLOPS161 PFLOPS

Характеристики карты ровно вдвое уступают флагманским AI-ускорителям AMD MI350X и MI355X. MI350P работает на архитектуре AMD CDNA4 и производится по техпроцессам TSMC 3 нм и 6 нм FinFET. GPU оснащён 8192 ядрами, 128 вычислительными блоками, 512 матричными ядрами и имеет максимальную тактовую частоту 2,2 ГГц. Карта оснащена 144 ГБ памяти HBM3E с пропускной способностью 4 ТБ/с и 128 МБ кеш-памяти последнего уровня.

Как и MI350X с MI355X, MI350P поддерживает вычисления с пониженной точностью MXFP6 и MXFP4 для ускорения работы больших языковых моделей (LLM). В одной системе можно объединить до восьми карт MI350P, что позволяет центрам обработки данных масштабировать производительность в зависимости от количества используемых ускорителей. MI350P ориентирован на задачи ИИ малого, среднего и крупного масштаба, связанные с выводами (инференсом) и конвейерами RAG. AMD утверждает, что этот GPU является самым быстрым корпоративным PCIe-ускорителем, достигая пиковой производительности в 2299 TFLOPs и 4600 TFLOPs при использовании MXFP4.

Появление MI350P наконец даёт AMD достойного конкурента самому быстрому PCIe-ускорителю Nvidia, которым на данный момент является H200 NVL. MI350P, основанный на более новой архитектуре, превосходит H200 NVL по производительности: на 20% лучше в FP64, на 43% лучше в FP16 и на 39% лучше в теоретических вычислениях FP8.

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

(Источник изображения: AMD)

Nvidia пока не анонсировала PCIe-версию своих новейших GPU Blackwell B200 с памятью HBM, так что на данный момент AMD будет предлагать самый передовой AI-ускоритель в форм-факторе PCIe. Насколько широко будет востребована новая карта AMD, пока неясно, учитывая доминирование Nvidia на рынке с её экосистемой CUDA. Однако AMD активно работает над улучшением своего конкурирующего программного стека ROCm, о чём производитель GPU рассказал нам на выставке CES 2026.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ в комментариях

Вы можете задать вопрос нашему ИИ-помощнику прямо в комментариях к этой статье. Он постарается быстро ответить или уточнить информацию.

⚠️ ИИ может ошибаться — проверяйте важную информацию.


0 комментариев

Оставить комментарий


Все комментарии - Технологии