AMD раскрывает основные характеристики ИИ-ускорителя Instinct MI355X CDNA4

/ ТехнологииНовости / Технологии

AMD

Advanced Micro Devices, Inc. (AMD, дословный перевод с англ. — «передовые микроустройства») — производитель интегральной микросхемной электроники. Второй по объему производства и продаж производитель процессоров архитектуры x86 c долей рынка 16,9 %▲(2014), а также один из крупнейших производителей графических процессоров (после приобретения ATI Technologies в 2006 году), чипсетов для материнских плат и флеш-памяти. Компания с 2009 года не имеет собственного производства и размещает заказы на мощностях других компаний. Википедия

Читайте также:AMD выпустила ускоритель Instinct MI325X для ИИДокументация ROCm от AMD теперь включает в себя специальный ROCm для RadeonРаскрыты системные требования Red Dead Redemption для ПКAMD выпустила ограниченный набор Lego с EPYC Genoa 4-го поколенияКарманный ПК на базе AMD Ryzen со складной клавиатурой выходит на Kickstarter

сегодня предоставила больше подробностей о своем грядущем ИИ-ускорителе Instinct MI350 CDNA4 и графическом процессоре для центров обработки данных, официально анонсировав Instinct MI355X. Она также предоставила дополнительные подробности о уже поставляемом MI325X, который, по-видимому, получил небольшое сокращение объема памяти с момента последнего обсуждения AMD.
MI355X планируется начать поставлять во второй половине 2025 года, так что это еще далеко. Тем не менее, в последние годы AMD наблюдала массовое внедрение своих ускорителей ИИ, а серия MI300 стала самым быстрым продуктом в истории AMD, поэтому, как и Nvidia

NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия

Читайте также:NVIDIA настраивает память GeForce RTX 5080 GDDR7 до 32 Гбит/с, RTX 5070 представлена на выставке CESMicrosoft Azure демонстрирует первые в мире индивидуальные стойки Nvidia BlackwellПлатформа вычислительной литографии NVIDIA cuLitho переходит в производство на TSMCNvidia и MediaTek сотрудничают в разработке 3-нм процессора для ПК с искусственным интеллектомNVIDIA DLSS приходит в FragPunk, Silent Hill 2 и другие игры

, теперь она находится на ежегодном этапе запуска продуктов.

Годовая частота AMD Instinct. / Изображение: AMD

Давайте начнем с нового Instinct MI355X. Вся серия MI350 выглядит немного странно с точки зрения брендинга, учитывая, что CDNA использовалась с MI100, затем CDNA2 в серии MI200, а CDNA3 поддерживала серию MI300 в течение последнего года или около того. И теперь у нас есть CDNA4, поддерживающий... MI350. Почему? Мы спрашивали и посмотрим, будет ли хороший ответ. Серия MI400 уже находится в разработке, в настоящее время запланирована на запуск в 2026 году, и, возможно, она уже была в разработке до того, как AMD изменила стратегию и решила добавить несколько дополнительных продуктов.

Независимо от названия продукта, CDNA4 представляет собой новую архитектуру. AMD заявила в нашем брифинге, что это была «полная переработка», хотя это, возможно, небольшое преувеличение. MI355X будет использовать новейший узел процесса N3 от TSMC, который требует фундаментальной переработки по сравнению с N5, но основная конструкция, вероятно, останется весьма похожей на CDNA3. Новое — это поддержка типов данных FP4 и FP6.

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

AMD представляет MI355X как «превью» того, что будет, и, как мы обсудим ниже, это означает, что некоторые из окончательных спецификаций могут измениться. Он будет поддерживать до 288 ГБ памяти HBM3E, предположительно, в восьми стеках. AMD заявила, что он получит 10 «вычислительных элементов» на GPU, что на самом деле не говорит нам многого о потенциале само по себе, но AMD предоставила некоторые другие начальные спецификации.

MI300X в настоящее время предлагает 1,3 петафлопс вычислений FP16 и 2,61 петафлопс FP8. MI355X для сравнения увеличит эти показатели до 2,3 и 4,6 петафлопс для FP16 и FP8. Это на 77% больше по сравнению с предыдущим поколением — и обратите внимание, что MI325X имеет те же вычисления, что и MI300X, только с на 33% больше памяти HBM3E и более высоким TDP.

Однако MI355X не просто имеет больше сырых вычислений. Введение числовых форматов FP4 и FP6 снова удваивает потенциальные вычисления по сравнению с FP8, так что один MI355X предлагает до 9,2 петафлопс вычислений FP4. Это интересное число, поскольку Nvidia Blackwell B200 также предлагает 9 петафлопс плотных вычислений FP4 — с более мощной реализацией GB200, предлагающей 10 петафлопс FP4 на GPU.

Исходя только из этой спецификации, AMD потенциально обеспечит примерно такую же вычислительную мощность ИИ с MI355X, какую Nvidia получит с Blackwell. Однако AMD также предложит до 288 ГБ памяти HBM3E, что на 50% больше, чем Nvidia предлагает с Blackwell прямо сейчас. И Blackwell, и MI355X получат пропускную способность 8 ТБ/с на GPU.

Конечно, ИИ — это не только вычисления, емкость памяти и пропускная способность. Масштабирование до большего количества графических процессоров часто становится ограничивающим фактором после определенного момента, и у нас нет никаких подробностей о том, вносит ли AMD какие-либо изменения в межсоединения между графическими процессорами. Это то, о чем Nvidia довольно много говорила в своем объявлении Blackwell, так что на это стоит обратить внимание, когда продукты начнут поставляться.

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

Другая часть сегодняшнего объявления AMD Instinct заключается в том, что MI325X официально запущен и войдет в полномасштабное производство в этом квартале. Однако вместе с объявлением приходит интересный кусочек: AMD сократила максимальный поддерживаемый объем памяти с 288 ГБ (так было заявлено ранее) до 256 ГБ на GPU.

Главным изменением от MI300X к MI325X стал объем памяти на GPU, причем MI300X предлагал до 192 ГБ. Поэтому изначально AMD рассчитывала на 50%-ное увеличение с MI325X, но теперь она сократила это увеличение до 33%.

AMD показала несколько показателей производительности, сравнивая MI325X с Nvidia H200, с небольшим преимуществом в производительности одного GPU и паритетом для платформы с восемью GPU. Ранее мы упоминали, что масштабирование может быть критическим фактором для платформ ИИ, и это указывает на то, что Nvidia все еще имеет некоторые преимущества в этой области.

AMD не стала вдаваться в подробности ценообразования своих ИИ-ускорителей, но, когда ее спросили, она заявила, что ее цель — обеспечить преимущество TCO (совокупная стоимость владения). Это может быть достигнуто либо путем предложения лучшей производительности за ту же цену, либо путем более низкой цены за ту же производительность, либо где-то в этом спектре. Или, как выразилась AMD: «Мы ответственные деловые люди, и мы будем принимать ответственные решения» — в том, что касается ценообразования.

Остается только посмотреть, как новейшие компоненты AMD будут сочетаться с H100 и H200 от Nvidia в различных рабочих нагрузках, не говоря уже о грядущем семействе Blackwell B200. Очевидно, что ИИ в последнее время стал крупным финансовым благом для Nvidia и AMD, и пока это не изменится, мы можем ожидать увидеть быстрые темпы развития и усовершенствования для центра обработки данных.

Полный набор слайдов презентации можно найти ниже, а большинство оставшихся слайдов содержат справочную информацию о рынке ускорителей ИИ и партнерах AMD.

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

(Изображение предоставлено: AMD)

Источник: Tomshardware.com

  • Rutab-GPT   
  • 0
Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Новые комментарии

Робот «Фёдор» (FEDOR — Final Experimental Demonstration Object Research) — это российский антропоморфный робот, разработанный ФПИ и НПО «Андроидная техника». В 2019 году он даже летал на МКС, но...
  • Rutab
Ошибка 5188 в MemTest86+ указывает на проблему с оперативной памятью (DDR4). Попробуйте следующие шаги: 1. Проверьте каждую планку RAM по отдельности — возможно, одна из них неисправна. 2....
  • Rutab
а разве рыцари Круглого стола и викинги не были чернокожими???
  • Анон
игра с формированием ложного самомнения через подхалимаж. ---По образу и подобию .....
  • Анон
Если игра упирается в производительность видеокарты, то хоть заускоряй процессор, а FPS больше не будет. Я у себя на синтетических тестах получил лишь меньшую задержку памяти. В играх практически...
  • Анон
Всё в порядке с физикой: источник может быть меньше четверти длины волны. Даже одиночный ион в ионной ловушке может излучать видимый свет (а размер меньше 0.2нм).
  • Анон
Можно делать смартфоны и планшеты на этом процессоре и наконец то использовать полноценную windows. Это отличная замена процессорам arm
  • Анон
Странно почему не 50 долларов.
  • Анон
Понимаю мощь производительность и все дела, но как черт возьми тепло отделять от камня если его прям нагрузить
  • Анон
Не предвзятость это - "Интересно, что Arc B580 проигрывает RTX 4060 в OpenCL" - где разница на невероятных 3,5 %, "но реабилитируется с НЕЗНАЧИТЕЛЬНЫМ 6%-ным преимуществом в Vulkan.". Не...
  • Анон

Смотреть все