Exascale-суперкомпьютер Aurora для исследователей
Министерство энергетики США (англ. United States Department of Energy, DOE) — исполнительный департамент правительства США, отвечающий за энергетическую политику, включая ядерную энергетику, в США, а также за разработку и производство ядерного оружия. Википедия
Иску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ.
Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами.
Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия
Читайте также:Модель R1-Zero воспроизводит технологии DeepSeek за 30 долларовKIOXIA выпустила ПО AiSAQ для снижения потребности в DRAMSolidigm продлевает соглашение с Broadcom о выпуске SSD-контроллеров высокой емкости для ИИТретья китайская компания начинает производство памяти HBM для процессоров ИИ: отчетСША готовят «Звездные врата»: 500 миллиардов долларов на развитие инфраструктуры ИИ
«Мы в восторге от официального развертывания Aurora для открытых научных исследований», — сказал Майкл Папка, директор Argonne Leadership Computing Facility (ALCF), пользовательского центра Управления науки Министерства энергетики. «Первые пользователи дали нам представление об огромном потенциале Aurora. Мы с нетерпением ждем, как более широкое научное сообщество будет использовать систему для трансформации своих исследований».
Эксафлопс и ИИ: ускорение науки
Aurora — один из первых в мире суперкомпьютеров exascale, наряду с Frontier в Национальной лаборатории Оук-Ридж DOE и El Capitan в Национальной лаборатории Лоуренса в Ливерморе DOE. Exascale относится к системам, способным выполнять по крайней мере один exaflop — квинтиллион (или миллиард миллиардов) вычислений в секунду. Машины DOE не только первые, достигшие exascale, но и в настоящее время являются тремя самыми быстрыми системами в мире.
Aurora уже зарекомендовала себя как одна из ведущих в мире систем по производительности ИИ, заняв первое место в бенчмарке HPL-MxP в ноябре 2024 года. Ее передовые возможности для задач ИИ используются учеными для открытия новых материалов для аккумуляторов, разработки новых лекарств и ускорения исследований в области термоядерной энергии. Перед ее развертыванием команда под руководством Аргонна продемонстрировала потенциал Aurora, используя ее для обучения моделей ИИ для инновационной структуры проектирования белков.
«Большой целью Aurora является обучение больших языковых моделей для науки», — сказал Рик Стивенс, заместитель директора лаборатории Аргонна по вычислениям, окружающей среде и наукам о жизни. «Например, с помощью проекта AuroraGPT мы создаем ориентированную на науку базовую модель, которая может извлекать знания из многих областей от биологии до химии. Одна из целей Aurora — дать исследователям возможность создавать новые инструменты ИИ, которые помогут им добиваться прогресса так же быстро, как они могут думать, а не просто так быстро, как их вычисления».
Среди первоначальных проектов на Aurora исследователи работают над разработкой высокоточных моделей сложных систем, таких как кровеносная система человека, ядерные реакторы и сверхновые, чтобы получить новое представление об их поведении. Кроме того, его способность обрабатывать огромные наборы данных имеет решающее значение для анализа растущих потоков данных из крупномасштабных исследовательских установок, таких как Argonne's Advanced Photon Source (APS), пользовательская установка Управления науки DOE и Большой адронный коллайдер CERN.
«Проекты, реализуемые на Aurora, представляют собой некоторые из самых амбициозных и инновационных научных разработок, которые происходят сегодня», — сказала Кэтрин Райли, директор по науке ALCF. «От моделирования чрезвычайно сложных физических систем до обработки огромных объемов данных, Aurora ускорит открытия, которые углубляют наше понимание окружающего мира».
Совместная разработка: создание и подготовка Aurora для науки
Развертывание Aurora знаменует собой кульминацию многолетнего сотрудничества. Созданная в партнерстве с Intel и Hewlett Packard Enterprise (HPE), Aurora оснащена 63 744 GPU (графическими процессорами) и 84 992 сетевыми конечными точками, что делает ее одной из крупнейших суперкомпьютерных установок на сегодняшний день. Охватывая восемь рядов шкафов размером с холодильник, машина весит 600 тонн, занимает площадь 10 000 квадратных футов — размер двух профессиональных баскетбольных площадок — и соединена между собой 300 милями сетевых кабелей.
«Внедрение системы такого масштаба в жизнь сопряжено с уникальным набором проблем», — сказала Сьюзан Коглан, директор проекта ALCF в Aurora. «Это потребовало работы с совершенно новыми технологиями в беспрецедентном масштабе. Увидеть машину полностью работоспособной и готовой поддерживать науку — это говорит о тяжелой работе и опыте всех участников».
Чтобы гарантировать готовность Aurora к науке с первого дня ее развертывания, система была создана с помощью совместного процесса, называемого совместным проектированием. Используя этот подход, команда Aurora разработала системное аппаратное и научное программное обеспечение в тандеме для оптимизации производительности и удобства использования. Это потребовало многолетнего сотрудничества между ALCF, Intel, HPE и исследователями по всей стране, участвующими в проекте Exascale Computing Project (ECP) DOE и программе Aurora Early Science Program (ESP) ALCF.
Пока устанавливалась Aurora, команды ECP и ESP запускали приложения для стресс-тестирования оборудования, одновременно оптимизируя свои коды для максимально эффективной работы в системе. В результате десятки научных приложений, а также широкий спектр программного обеспечения и инструментов программирования были готовы для Aurora до того, как она поступила в производство.
«Часть процесса запуска нового суперкомпьютера в сеть включает в себя его тестирование с реальными кодами, решающими реальные научные задачи», — сказал Калян Кумаран, директор по технологиям ALCF. «Это ключ к достижению нашей цели — дать возможность науке заниматься ею с первого дня запуска нового суперкомпьютера».
Теперь, когда Aurora находится в производстве, она начала поддерживать более 70 различных научных и инженерных проектов. Сюда входят проекты из Программы ранней науки, а также те, которым было выделено вычислительное время по двум основным программам распределения DOE: Innovative and Novel Computational Impact on Theory and Experiment (INCITE) и ASCR Leadership Computing Challenge (ALCC). ALCF также принимает запросы на распределение по усмотрению директора от исследователей, которым необходимо решить задачи с интенсивными вычислениями.
Источник: Techpowerup.com
0 комментариев