Western Digital подтвердила производительность хранилищ для ИИ в тестах MLPerf Storage V2
С ростом сложности и масштабов задач искусственного интеллекта способность систем хранения данных успевать за ускоренной вычислительной инфраструктурой стала критически важным фактором. Компания Western Digital (Nasdaq: WDC) объявила результаты своих тестов MLPerf Storage V2, подтвердив реальную производительность платформы хранения OpenFlex Data24 4000 Series NVMe-oF. Результаты демонстрируют, что OpenFlex Data24 EBOF (Ethernet bunch of flash) справляется с высокими требованиями современных ИИ-нагрузок, обеспечивая производительность, эффективность и масштабируемость в экономичном решении для ИИ-инфраструктуры.
Платформа Western Digital OpenFlex Data24 NVMe-oF расширяет возможности NVMe-накопителей через Ethernet, обеспечивая низкую задержку и общее хранилище для масштабируемой распределённой ИИ-инфраструктуры. Разработанная для упрощения развёртывания, снижения затрат и адаптации к растущему спросу на GPU, OpenFlex Data24 позволяет независимо масштабировать хранилища и вычислительные мощности.
Для отражения реалистичных сценариев, где системы хранения должны соответствовать ускоренной GPU-инфраструктуре, Western Digital сотрудничала с PEAK:AIO — поставщиком высокопроизводительных программно-определяемых хранилищ (SDS), способных быстро обрабатывать большие объёмы данных.
В тестах использовались NVMe SSD KIOXIA CM7-V Series, выбранные за их выдающуюся производительность в сложных ИИ-задачах. При развёртывании в OpenFlex Data24 они обеспечивают стабильную высокую скорость передачи данных на множество GPU-узлов.
Результаты тестов MLPerf Storage V2
MLPerf считается золотым стандартом для тестирования ИИ-систем. Результаты Western Digital показывают, что их архитектура не только обеспечивает производительность, но и делает это с упором на эффективность и экономику развёртывания — как с программно-определяемым хранилищем (SDS), так и без него.
Тесты MLPerf Storage используют GPU-узлы, имитирующие поведение серверов ИИ при обучении или выводе данных, чтобы оценить, насколько хорошо платформа хранения поддерживает распределённые ИИ-среды. В тестах измеряется эффективность работы с разными аспектами ввода-вывода, включая пропускную способность и параллелизм.
Тест 3D U-Net
3D U-Net — модель глубокого обучения для медицинской визуализации и объёмной сегментации. Она создаёт высокую нагрузку на хранилища из-за больших 3D-наборов данных и интенсивного чтения. В этом тесте:
- OpenFlex Data24 показал устойчивую пропускную способность 106,5 ГБ/с (99,2 ГиБ/с), насыщая 36 виртуальных GPU H100 на трёх узлах.
- С PEAK:AIO AI Data Server платформа обеспечила 64,9 ГБ/с (59,6 ГиБ/с), насыщая 22 виртуальных GPU H100 с одного сервера.
Тест ResNet50
ResNet-50 — свёрточная нейросеть для классификации изображений. В этом тесте OpenFlex Data24 показал оптимальную производительность на 186 виртуальных GPU H100 и трёх узлах.
«Эти результаты подтверждают, что распределённая архитектура Western Digital — ключевой элемент ИИ-инфраструктуры нового поколения, максимизирующий использование GPU при минимизации затрат», — заявил Курт Чан, вице-президент Western Digital.
«Комбинация PEAK:AIO и OpenFlex Data24 обеспечивает высокую производительность без излишней сложности», — добавил Роджер Каммингс, CEO PEAK:AIO.
Платформа OpenFlex Data24 с адаптерами Western Digital RapidFlex позволяет подключать до 12 узлов без коммутатора, упрощая масштабирование ИИ-инфраструктуры.
Источник: Techpowerup.com
0 комментариев