AMD делится достижениями 30x25: новые машины ИИ в 28,3 раза быстрее машин 2020 года

/ ТехнологииНовости / Технологии

Эффективность производительности является ключом к быстрому повышению производительности процессоров AI и HPC, поэтому AMD

Advanced Micro Devices, Inc. (AMD, дословный перевод с англ. — «передовые микроустройства») — производитель интегральной микросхемной электроники. Второй по объему производства и продаж производитель процессоров архитектуры x86 c долей рынка 16,9 %▲(2014), а также один из крупнейших производителей графических процессоров (после приобретения ATI Technologies в 2006 году), чипсетов для материнских плат и флеш-памяти. Компания с 2009 года не имеет собственного производства и размещает заказы на мощностях других компаний. Википедия

Читайте также:AMD выпускает адаптивные SoC Versal RFТаинственный AMD Ryzen AI MAX+ Pro 395 Strix Halo APU появился на GeekbenchValve готовит загадочное устройство SteamOS «Fremont» на базе процессора AMD RyzenСообщается, что эксклюзивный партнер AMD присоединяется к Intel ArcAMD подтвердила Radeon RX 8600 и RX 8800?

и другие компании яростно борются за нее с каждым новым поколением продуктов. Еще в 2021 году компания поставила себе цель к 2025 году повысить энергоэффективность своих процессоров EPYC и ускорителей Instinct в 30 раз по сравнению с 2020 годом. Похоже, что с ее новейшими процессорами серии EPYC 9005 «Turin» и графическими процессорами Instinct MI300X она близка к достижению своей цели.

Изображение: AMD

Чтобы доказать свою точку зрения, AMD использовала машину, оснащенную двумя 64-ядерными процессорами EPYC 9575F, восемью ускорителями Instinct MI300X, 2304 ГБ памяти DDR5, и протестировала ее производительность вывода в модели Llama3.1-70B (vLLM 0.6.1.post2, TP8 Parallel, FP8, continuous batching). Используя сложный набор вычислений, AMD определила энергоэффективность этой системы и сравнила ее с неизвестной машиной 2020 года, обнаружив, что новая машина в 28,3 раза энергоэффективнее старой.

AMD не раскрывает технические характеристики своей системы 2020 года, хотя можно предположить, что она основана на процессорах серии EPYC 7002 с микроархитектурой Zen 2 с числом ядер до 64 на ЦП, а также на ускорителях Instinct MI100 на базе архитектуры CDNA 1.

Instinct MI100 от AMD не поддерживает FP8 (в отличие от MI300X, который поддерживает его с той же скоростью, что и INT8), хотя если мы сравним производительность INT8 у MI100 (184,6 TOPS) и MI300X (2615 TOPS/5230 TOPS с разреженностью), разница на бумаге составит 14–28 раз. Примерно такую же разницу можно наблюдать и с FP16, поэтому сравнение

Сравне́ние — процесс количественного или качественного сопоставления разных свойств (сходств, отличий, преимуществ и недостатков) двух (и более) объектов, выяснение, какой из двух (и более) объектов лучше в целом («интегральное сопоставление»), утверждение, что данные объекты равны или подобны, приравнивание, уподобление. Возможные значения: Сравнение в ряде социальных наук и в философии — познавательная операция, лежащая в основе суждений о сходстве или различии объектов. Сравнение по модулю натурального числа — понятие, на котором основана модулярная арифметика, применяющаяся во многих областях математики. Сравнение в программировании — общее название ряда операций над па́рами значений одного типа, реализующих математические отношения равенства и порядка. Википедия

справедливо. Если учесть значительно улучшенные подсистемы памяти (32 ГБ HBM2 со скоростью 1,20 ГБ/с против 192 ГБ HBM3 со скоростью 5,30 ГБ/с) и значительно улучшенные процессоры, неудивительно, что существующие машины AMD значительно быстрее и производительнее, чем ее системы 2020 года.

По словам самой AMD, помимо «грубой силы» аппаратных улучшений, более высокая производительность была достигнута за счет сочетания архитектурных усовершенствований и программной оптимизации, чего и следовало ожидать.

Совсем недавно компания представила свои ускорители Instinct MI325X на базе архитектуры CDNA 3, но с подсистемой памяти HBM3E объемом 288 ГБ. В следующем году компания собирается выпустить свои процессоры Instinct MI355X, которые будут основаны на архитектуре CDNA 4 и повысят производительность вычислений FP8 и FP16 примерно на 80% по сравнению с MI325X. В дополнение к FP8 и FP16, MI325X добавит поддержку форматов FP4 и FP6 для ИИ

Thumbnail: Искусственный интеллектИску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

Читайте также:Marvell анонсирует новую архитектуру HBM для ИИ-ускорителейNVIDIA демонстрирует будущий дизайн ускорителя ИИ: кремниевая фотоника и DRAM поверх вычисленийУтверждается, что актеры из Black Ops 6 Zombies ушли из-за отсутствия защиты ИИГлава PlayStation: ИИ не заменит созданный вручную контентРоль человека в создании игр — мнение гендиректора PlayStation

, что увеличит его пиковую производительность до 9,2 петафлопс (FP4), что будет полезно для многих крупных языковых моделей. Тем не менее, AMD более чем на пути к достижению 30-кратной более высокой энергоэффективности своих вычислительных платформ к 2025 году по сравнению с 2025 годом.

«Благодаря нашему продуманному подходу к совместному проектированию аппаратного и программного обеспечения мы уверены в том, что наша дорожная карта позволит превзойти цель 30x25, и с воодушевлением смотрим на открывающиеся возможности, в которых мы видим путь к значительному повышению энергоэффективности в течение следующих нескольких лет», — написал Сэм Наффцигер, старший вице-президент, корпоративный сотрудник AMD и архитектор продуктовых технологий в AMD.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Поддерживаю. А еще если брать в разрезе Илон Маск и безопасность данных, то вообще смешно. Особенно для жителей РФ)О конфиденциальности можно забыть
  • Анон
1c пох на ваши операции, количество ядер и прочее. Умудрились написать ядро четко привязанное к Мгц. Единственный в мире продукт для 1го ядра.
  • Анон
Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон
требуется указать магазин и purchase date без этого не регистрирует
  • Анон
Россия на них клала❤❤❤❤, будет называться Ладушка 2.0 )))
  • Анон
ДА у меня тоже неработает уже все Вы не знаете каким способом вернуть все обратно СПАСИ
  • Анон

Смотреть все