Суперкомпьютеру Aurora на базе Intel снова не удалось свергнуть Frontier на базе AMD в списке Top-500
«И́нтел» («Intel Corp.», МФА: [ˈɪntɛl ˌkɔːpə'reɪʃən]) — производитель электронных устройств и компьютерных компонентов (включая микропроцессоры, наборы системной логики (чипсеты) и др). Штаб-квартира — в Санта-Кларе (США, штат Калифорния). Википедия
Читайте также:Samsung ускоряет внедрение на рынок стеклянных подложек для микросхемВендор выпускает материнскую плату Intel для любителей анимеIntel приобрела все сканеры High-NA EUV, которые ASML выпустит в этом годуМатеринские платы MSI будут соответствовать спецификациям Intel для Core i9В сеть утекли процессоры Intel следующего поколения для настольных ПК Arrow Lake
Advanced Micro Devices, Inc. (AMD, дословный перевод с англ. — «передовые микроустройства») — производитель интегральной микросхемной электроники. Второй по объему производства и продаж производитель процессоров архитектуры x86 c долей рынка 16,9 %▲(2014), а также один из крупнейших производителей графических процессоров (после приобретения ATI Technologies в 2006 году), чипсетов для материнских плат и флеш-памяти. Компания с 2009 года не имеет собственного производства и размещает заказы на мощностях других компаний. Википедия
Читайте также:Утечка AMD Strix Point: TDP 120 Вт и 64 ГБ оперативной памятиAMD решает проблемы с ПО искусственного интеллектаGolden Pig рассказала о линейке AMD Zen 5 и представила десятиядерные чипы Strix PointAMD теснит Intel на рынке процессоровСтал известен новый ребрендинг AMD Ryzen AI для Zen 5
Примечательно, что система Aurora до сих пор не полностью работоспособна, поэтому вся машина не использовалась ни для одного из представленных тестов. Aurora по-прежнему сталкивается с многочисленными аппаратными проблемами (подробности в последнем разделе ниже), и продолжающиеся проблемы немного удивительны: система была впервые анонсирована девять лет назад, вторая версия была анонсирована пять лет назад (первая версия была отменена), а последние компоненты были установлены одиннадцать месяцев назад.
В системе установлено 21 248 процессоров и 63 744 графических процессора, распределенных по 10 624 вычислительным модулям, но Аргоннская национальная лаборатория (ANL), в которой размещена система, снова не смогла представить полный запуск Linpack для списка Top-500.
Вместо этого Aurora заняла второе место с производительностью 1,012 эксафлопс, преодолев барьер эксафлопс с 87% активной системы (9234 из полных 10624 узлов). Это укрепляет второе место Авроры — первая подача Авроры (с половиной системы) также заняла второе место, достигнув 585,34 петафлопс шесть месяцев назад.
Предполагается, что Aurora будет быстрее, чем Frontier в высокопроизводительном тесте Linpack (тест HP, и, таким образом, после завершения возглавит рейтинг Top-500, но очевидно, что системе потребуется дополнительная настройка, чтобы соответствовать заявленным характеристикам. Frontier работает примерно на 19% быстрее). чем Aurora с производительностью 1,206 эксафлопс, и, при условии линейного масштабирования, Aurora все равно не выиграет после добавления оставшихся 13% узлов, которые не использовались для запуска теста Top-500.
Intel широко расхваливала теоретическую пиковую производительность Aurora в 2 эксафлопс (Rpeak), но суперкомпьютеры измеряются устойчивой производительностью (Rmax). Tomshardware спросил у ANL, ожидается ли, что Aurora после завершения возглавит Frontier в Top-500. «Есть договорное целевое число, которое выше, чем у Frontier», — ответил представитель. «Итак, если нам удастся достичь этого числа, мы будем быстрее, чем Frontier». Примечательно, что в заявлении говорится, что Aurora должна победить Frontier, но это не так. Мы добились твердого подтверждения фактического целевого показателя производительности.
Aurora заняла первое место в тесте смешанной точности HPL-MxP с производительностью ИИ 10,6 эксафлопс при активном уровне только 89% системы Aurora. Этот тест отдает приоритет более низкой точности (FP32 и ниже, даже FP16), чем FP64, используемый для теста Linpack, используемого для рейтинга Top-500. Таким образом, этот тест лучше отражает рабочие нагрузки ИИ и растущее число других реальных приложений — FP64 в значительной степени отнесен к традиционным научным вычислениям, и некоторые утверждают, что это тоже сокращающаяся часть этого сегмента.
HPL-MxP становится все более важным для моделирования реальной производительности в эпоху искусственного интеллекта, но позиция Aurora на вершине будет горячо оспариваться. Масштабная система на базе Nvidia Grace-Hopper еще не попала в таблицу лидеров. На суперкомпьютере Alps, который теперь обещает производительность искусственного интеллекта в 20 эксафлопс, планируется установить 10 752 процессора Grace Hopper к концу июня 2024 года, поэтому борьба за лидерство обостряется.
Тест High Performance Conjugate Gradients (HPCG) также разработан таким образом, чтобы быть более репрезентативным для приложений с реальными рабочими нагрузками, чем Linpack. Aurora также показала впечатляющие результаты в этом тесте, заняв третье место в рейтинге с всего 38,5% активных суперкомпьютеров. Aurora также заняла пятое место в тесте Graph500, который предназначен для измерения производительности в приложениях с интенсивным использованием данных, но ANL не уточнила, какая часть системы была активна во время этого теста.
Aurora не попала в Green500, список самых энергоэффективных суперкомпьютеров, и это неудивительно. Aurora будет потреблять до 60 мВт пиковой мощности, что вдвое больше, чем у Frontier (29 мВт), но мы не знаем, как будут выглядеть ее окончательные характеристики. Неясно, сможет ли Aurora превзойти Frontier по производительности Linpack, но даже если она выиграет, то с небольшим отрывом — явно недостаточным, чтобы оправдать повышенное энергопотребление для этой конкретной рабочей нагрузки. Однако существует множество других приложений, которые работают с более низкой точностью, и сравнение энергоэффективности зависит от приложения.
Aurora сталкивается с аппаратными сбоями, неисправностями системы охлаждения и другими проблемами
Между установкой окончательного оборудования Aurora и моментом, когда ANL представила свои тесты, прошло десять долгих месяцев, что вызвало вопросы об источнике продолжающейся задержки с запуском всей машины.
«[...]Поскольку мы завершили физическую поставку последнего вычислительного узла в конце июня 2023 года (всего 10 месяцев назад), мы работаем рука об руку с Аргоннской национальной лабораторией и HPE над полной стабилизацией и настройкой системы, включая вычислительные узлы, систему хранения данных, коммутационную структуру, систему электропитания и систему охлаждения».
«Мы также активно работаем над решением проблем стабильности, таких как аппаратные сбои, ошибки программного обеспечения, неисправности системы охлаждения, проблемы с электропитанием, стабильность сетевой инфраструктуры, факторы окружающей среды и эксплуатационные ошибки», — сказал представитель Intel Tom's Hardware.
Аргоннские национальные лаборатории и Intel еще не назвали точную дату, когда они ожидают, что система будет полностью работоспособна, но мы знаем, что окно Aurora на лидерство в Top-500 закрывается. Ожидается, что процессор El Capitan на базе AMD, рассчитанный на пиковую производительность в два эксафлопса (неустойчивый), превзойдет Aurora и Frontier в Linpack. Лаборатория Лоуренса Ливермора сегодня представила предварительные результаты по субмасштабным моделям Эль-Капитана, и ожидается, что система будет полностью установлена к концу 2024 года.
0 комментариев