AMD делится достижениями 30x25: новые машины ИИ в 28,3 раза быстрее машин 2020 года

11 декабря 2024, 16:47 / Технологии → Новости / Технологии

Эффективность производительности является ключом к быстрому повышению производительности процессоров AI и HPC, поэтому AMD

Advanced Micro Devices, Inc. (AMD, дословный перевод с англ. — «передовые микроустройства») — производитель интегральной микросхемной электроники. Второй по объему производства и продаж производитель процессоров архитектуры x86 c долей рынка 16,9 %▲(2014), а также один из крупнейших производителей графических процессоров (после приобретения ATI Technologies в 2006 году), чипсетов для материнских плат и флеш-памяти. Компания с 2009 года не имеет собственного производства и размещает заказы на мощностях других компаний. Википедия

и другие компании яростно борются за нее с каждым новым поколением продуктов. Еще в 2021 году компания поставила себе цель к 2025 году повысить энергоэффективность своих процессоров EPYC и ускорителей Instinct в 30 раз по сравнению с 2020 годом. Похоже, что с ее новейшими процессорами серии EPYC 9005 «Turin» и графическими процессорами Instinct MI300X она близка к достижению своей цели.

Изображение: AMD

Чтобы доказать свою точку зрения, AMD использовала машину, оснащенную двумя 64-ядерными процессорами EPYC 9575F, восемью ускорителями Instinct MI300X, 2304 ГБ памяти DDR5, и протестировала ее производительность вывода в модели Llama3.1-70B (vLLM 0.6.1.post2, TP8 Parallel, FP8, continuous batching). Используя сложный набор вычислений, AMD определила энергоэффективность этой системы и сравнила ее с неизвестной машиной 2020 года, обнаружив, что новая машина в 28,3 раза энергоэффективнее старой.

AMD не раскрывает технические характеристики своей системы 2020 года, хотя можно предположить, что она основана на процессорах серии EPYC 7002 с микроархитектурой Zen 2 с числом ядер до 64 на ЦП, а также на ускорителях Instinct MI100 на базе архитектуры CDNA 1.

Instinct MI100 от AMD не поддерживает FP8 (в отличие от MI300X, который поддерживает его с той же скоростью, что и INT8), хотя если мы сравним производительность INT8 у MI100 (184,6 TOPS) и MI300X (2615 TOPS/5230 TOPS с разреженностью), разница на бумаге составит 14–28 раз. Примерно такую же разницу можно наблюдать и с FP16, поэтому сравнение

Сравне́ние — процесс количественного или качественного сопоставления разных свойств (сходств, отличий, преимуществ и недостатков) двух (и более) объектов, выяснение, какой из двух (и более) объектов лучше в целом («интегральное сопоставление»), утверждение, что данные объекты равны или подобны, приравнивание, уподобление. Возможные значения: Сравнение в ряде социальных наук и в философии — познавательная операция, лежащая в основе суждений о сходстве или различии объектов. Сравнение по модулю натурального числа — понятие, на котором основана модулярная арифметика, применяющаяся во многих областях математики. Сравнение в программировании — общее название ряда операций над па́рами значений одного типа, реализующих математические отношения равенства и порядка. Википедия

справедливо. Если учесть значительно улучшенные подсистемы памяти (32 ГБ HBM2 со скоростью 1,20 ГБ/с против 192 ГБ HBM3 со скоростью 5,30 ГБ/с) и значительно улучшенные процессоры, неудивительно, что существующие машины AMD значительно быстрее и производительнее, чем ее системы 2020 года.

По словам самой AMD, помимо «грубой силы» аппаратных улучшений, более высокая производительность была достигнута за счет сочетания архитектурных усовершенствований и программной оптимизации, чего и следовало ожидать.

Совсем недавно компания представила свои ускорители Instinct MI325X на базе архитектуры CDNA 3, но с подсистемой памяти HBM3E объемом 288 ГБ. В следующем году компания собирается выпустить свои процессоры Instinct MI355X, которые будут основаны на архитектуре CDNA 4 и повысят производительность вычислений FP8 и FP16 примерно на 80% по сравнению с MI325X. В дополнение к FP8 и FP16, MI325X добавит поддержку форматов FP4 и FP6 для ИИ

Thumbnail: Искусственный интеллект Иску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

, что увеличит его пиковую производительность до 9,2 петафлопс (FP4), что будет полезно для многих крупных языковых моделей. Тем не менее, AMD более чем на пути к достижению 30-кратной более высокой энергоэффективности своих вычислительных платформ к 2025 году по сравнению с 2025 годом.

«Благодаря нашему продуманному подходу к совместному проектированию аппаратного и программного обеспечения мы уверены в том, что наша дорожная карта позволит превзойти цель 30x25, и с воодушевлением смотрим на открывающиеся возможности, в которых мы видим путь к значительному повышению энергоэффективности в течение следующих нескольких лет», — написал Сэм Наффцигер, старший вице-президент, корпоративный сотрудник AMD и архитектор продуктовых технологий в AMD.

Источник: Tomshardware.com

AMD делится достижениями 30x25: новые машины ИИ в 28,3 раза быстрее машин 2020 года

0 комментариев

Оставить комментарий

Все комментарии - Технологии