Суперкомпьютер Aurora теперь полностью работоспособен и доступен исследователям
На этой неделе Аргоннская национальная лаборатория заявила, что ее суперкомпьютер Aurora теперь полностью работоспособен и доступен научному сообществу. Машина, которая была анонсирована в 2015 году и столкнулась с серьезными задержками, теперь предлагает производительность более 1 FP64 ExaFLOPS для моделирования, а также 11,6 смешанной точности ExaFLOPS для искусственного интеллекта и машинного обучения.
«Мы в восторге от официального развертывания Aurora для открытых научных исследований», — сказал Майкл Папка, директор Argonne Leadership Computing Facility (ALCF), пользовательского центра Управления науки Министерства энергетики США. «Первые пользователи дали нам представление об огромном потенциале Aurora. Мы с нетерпением ждем, как более широкое научное сообщество будет использовать систему для трансформации своих исследований».
Доступность суперкомпьютера Aurora для открытых научных исследований можно считать формальным принятием системы ARNL, что знаменует собой важную веху для проблемной машины. Первоначально запланированная на 2018 год, Aurora не достигла этой цели из-за решения Intel прекратить выпуск процессоров Xeon Phi. После того, как машина была перепроектирована, проект столкнулся с новыми неудачами из-за задержки 7-нм техпроцесса Intel, из-за чего дата завершения была отодвинута на 2021 год, а затем снова на 2023 год.
Даже после установки оборудования в июне 2023 года потребовалось несколько месяцев, чтобы система полностью заработала и достигла эксафлопсной производительности, которую она, наконец, достигла в мае 2024 года. Однако в течение более чем полугода система была доступна только избранным исследователям.
Изображение: Intel
Хотя Aurora не является самым мощным суперкомпьютером для моделирования, поскольку его производительность FP64 едва превышает один ExaFLOPS, это самая мощная система для ИИ, поскольку она может достигать 11,6 ExaFLOPS смешанной точности согласно тесту HPL-MxP.
«Большой целью Aurora является обучение больших языковых моделей для науки», — сказал Рик Стивенс, заместитель директора лаборатории Аргонна по вычислениям, окружающей среде и наукам о жизни. «Например, с помощью проекта AuroraGPT мы создаем ориентированную на науку базовую модель, которая может извлекать знания из многих областей, от биологии до химии. Одна из целей Aurora — дать исследователям возможность создавать новые инструменты ИИ, которые помогут им добиваться прогресса так же быстро, как они могут думать, а не просто так быстро, как их вычисления».
Некоторые из первых исследовательских проектов с использованием Aurora — это детальное моделирование сложных систем, таких как кровеносная система человека, ядерные реакторы и взрывы сверхновых. Потрясающая производительность машины также играет важную роль в обработке данных из крупных исследовательских центров, таких как Advanced Photon Source (APS) в Аргонне и Large Hadron Collider в ЦЕРНе.
«Проекты, реализуемые на Aurora, представляют собой одни из самых амбициозных и инновационных научных достижений современности», — отметила Кэтрин Райли, директор по науке ALCF.
«От моделирования чрезвычайно сложных физических систем до обработки огромных объемов данных, Aurora ускорит открытия, которые углубят наше понимание окружающего мира».
Что касается аппаратного обеспечения, Aurora явно впечатляет. Суперкомпьютер состоит из 166 стоек, каждая из которых вмещает 64 лезвия, что в общей сложности составляет 10 624 лезвия. Каждый лезвие содержит два процессора Xeon Max с 64 ГБ памяти HBM2E на борту и шесть графических процессоров Intel Data Center Max 'Ponte Vecchio', все охлаждаются специализированной системой жидкостного охлаждения.
В общей сложности Aurora имеет 21 248 процессоров с более чем 1,1 миллиона высокопроизводительных ядер x86, 19,9 ПБ памяти DDR5 и 1,36 ПБ памяти HBM2E, подключенной к процессорам. Он также оснащен 63 744 графическими процессорами, оптимизированными для ИИ и HPC, оснащенными 8,16 ПБ памяти HBM2E. Aurora использует 1024 узла с твердотельными накопителями для хранения, предлагая 220 ПБ общей емкости и 31 ТБ/с пропускной способности. Машина основана на архитектуре суперкомпьютера HPE Shasta с межсоединениями Slingshot.
Источник: Tomshardware.com
0 комментариев