AMD раскрывает основные характеристики ИИ-ускорителя Instinct MI355X CDNA4

10 октября 2024, 21:35 / Технологии → Новости / Технологии

AMD

Advanced Micro Devices, Inc. (AMD, дословный перевод с англ. — «передовые микроустройства») — производитель интегральной микросхемной электроники. Второй по объему производства и продаж производитель процессоров архитектуры x86 c долей рынка 16,9 %▲(2014), а также один из крупнейших производителей графических процессоров (после приобретения ATI Technologies в 2006 году), чипсетов для материнских плат и флеш-памяти. Компания с 2009 года не имеет собственного производства и размещает заказы на мощностях других компаний. Википедия

сегодня предоставила больше подробностей о своем грядущем ИИ-ускорителе Instinct MI350 CDNA4 и графическом процессоре для центров обработки данных, официально анонсировав Instinct MI355X. Она также предоставила дополнительные подробности о уже поставляемом MI325X, который, по-видимому, получил небольшое сокращение объема памяти с момента последнего обсуждения AMD.

MI355X планируется начать поставлять во второй половине 2025 года, так что это еще далеко. Тем не менее, в последние годы AMD наблюдала массовое внедрение своих ускорителей ИИ, а серия MI300 стала самым быстрым продуктом в истории AMD, поэтому, как и Nvidia

NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия

, теперь она находится на ежегодном этапе запуска продуктов.

Годовая частота AMD Instinct. / Изображение: AMD

Давайте начнем с нового Instinct MI355X. Вся серия MI350 выглядит немного странно с точки зрения брендинга, учитывая, что CDNA использовалась с MI100, затем CDNA2 в серии MI200, а CDNA3 поддерживала серию MI300 в течение последнего года или около того. И теперь у нас есть CDNA4, поддерживающий... MI350. Почему? Мы спрашивали и посмотрим, будет ли хороший ответ. Серия MI400 уже находится в разработке, в настоящее время запланирована на запуск в 2026 году, и, возможно, она уже была в разработке до того, как AMD изменила стратегию и решила добавить несколько дополнительных продуктов.

Независимо от названия продукта, CDNA4 представляет собой новую архитектуру. AMD заявила в нашем брифинге, что это была «полная переработка», хотя это, возможно, небольшое преувеличение. MI355X будет использовать новейший узел процесса N3 от TSMC, который требует фундаментальной переработки по сравнению с N5, но основная конструкция, вероятно, останется весьма похожей на CDNA3. Новое — это поддержка типов данных FP4 и FP6.

(Изображение предоставлено: AMD)

AMD представляет MI355X как «превью» того, что будет, и, как мы обсудим ниже, это означает, что некоторые из окончательных спецификаций могут измениться. Он будет поддерживать до 288 ГБ памяти HBM3E

, предположительно, в восьми стеках. AMD заявила, что он получит 10 «вычислительных элементов» на GPU, что на самом деле не говорит нам многого о потенциале само по себе, но AMD предоставила некоторые другие начальные спецификации.

MI300X в настоящее время предлагает 1,3 петафлопс вычислений FP16 и 2,61 петафлопс FP8. MI355X для сравнения увеличит эти показатели до 2,3 и 4,6 петафлопс для FP16 и FP8. Это на 77% больше по сравнению с предыдущим поколением — и обратите внимание, что MI325X имеет те же вычисления, что и MI300X, только с на 33% больше памяти HBM3E и более высоким TDP.

Однако MI355X не просто имеет больше сырых вычислений. Введение числовых форматов FP4 и FP6 снова удваивает потенциальные вычисления по сравнению с FP8, так что один MI355X предлагает до 9,2 петафлопс вычислений FP4. Это интересное число, поскольку Nvidia Blackwell

B200 также предлагает 9 петафлопс плотных вычислений FP4 — с более мощной реализацией GB200, предлагающей 10 петафлопс FP4 на GPU.

Исходя только из этой спецификации, AMD потенциально обеспечит примерно такую же вычислительную мощность ИИ с MI355X, какую Nvidia получит с Blackwell. Однако AMD также предложит до 288 ГБ памяти HBM3E, что на 50% больше, чем Nvidia предлагает с Blackwell прямо сейчас. И Blackwell, и MI355X получат пропускную способность 8 ТБ/с на GPU.

Конечно, ИИ — это не только вычисления, емкость памяти и пропускная способность. Масштабирование до большего количества графических процессоров часто становится ограничивающим фактором после определенного момента, и у нас нет никаких подробностей о том, вносит ли AMD какие-либо изменения в межсоединения между графическими процессорами. Это то, о чем Nvidia довольно много говорила в своем объявлении Blackwell, так что на это стоит обратить внимание, когда продукты начнут поставляться.

(Изображение предоставлено: AMD)

Другая часть сегодняшнего объявления AMD Instinct заключается в том, что MI325X официально запущен и войдет в полномасштабное производство в этом квартале. Однако вместе с объявлением приходит интересный кусочек: AMD сократила максимальный поддерживаемый объем памяти с 288 ГБ (так было заявлено ранее) до 256 ГБ на GPU.

Главным изменением от MI300X к MI325X стал объем памяти на GPU, причем MI300X предлагал до 192 ГБ. Поэтому изначально AMD рассчитывала на 50%-ное увеличение с MI325X, но теперь она сократила это увеличение до 33%.

AMD показала несколько показателей производительности, сравнивая MI325X с Nvidia H200, с небольшим преимуществом в производительности одного GPU и паритетом для платформы с восемью GPU. Ранее мы упоминали, что масштабирование может быть критическим фактором для платформ ИИ, и это указывает на то, что Nvidia все еще имеет некоторые преимущества в этой области.

AMD не стала вдаваться в подробности ценообразования своих ИИ-ускорителей, но, когда ее спросили, она заявила, что ее цель — обеспечить преимущество TCO (совокупная стоимость владения). Это может быть достигнуто либо путем предложения лучшей производительности за ту же цену, либо путем более низкой цены за ту же производительность, либо где-то в этом спектре. Или, как выразилась AMD: «Мы ответственные деловые люди, и мы будем принимать ответственные решения» — в том, что касается ценообразования.

Остается только посмотреть, как новейшие компоненты AMD будут сочетаться с H100 и H200 от Nvidia в различных рабочих нагрузках, не говоря уже о грядущем семействе Blackwell B200. Очевидно, что ИИ в последнее время стал крупным финансовым благом для Nvidia и AMD, и пока это не изменится, мы можем ожидать увидеть быстрые темпы развития и усовершенствования для центра обработки данных.

Полный набор слайдов презентации можно найти ниже, а большинство оставшихся слайдов содержат справочную информацию о рынке ускорителей ИИ и партнерах AMD.