Solidigm открыла лабораторию с 23,6 ПБ данных в одной стойке для тестирования ИИ
Компания Solidigm объявила об открытии своей центральной лаборатории искусственного интеллекта, в которой, по её заявлению, размещены самые производительные и плотные тестовые кластеры хранения данных, созданные для рабочих нагрузок ИИ.
Лаборатория AI Central Lab, расположенная в Ранчо-Кордова на объекте FarmGPU недалеко от штаб-квартиры Solidigm, позволяет компании запускать и изучать реальные рабочие нагрузки на GPU NVIDIA B200 и H200. Это даёт компании представление о том, как системы хранения данных могут повысить эффективность кластеров, и позволяет ключевым партнёрам из экосистемы ИИ проводить эксперименты на оборудовании лаборатории.
Лаборатория включает несколько примечательных конфигураций. Производительный кластер на SSD Solidigm D7-PS1010 достиг пропускной способности 116 ГБ/с на узел в тестах MLPerf Storage — это самый высокий показатель, когда-либо измеренный в тесте обучения моделей ИИ. Кластер плотности вмещает 192 SSD Solidigm D5-P5336 ёмкостью 122 ТБ каждый, упаковывая 23,6 ПБ данных всего в 16 юнитов стоечного пространства. Дополнительное оборудование включает сети Ethernet 800 Гбит/с и серверы хранения данных.
Доступные для тестирования рабочие нагрузки включают обучение и вывод моделей ИИ, разгрузку KV-кэша, настройку VectorDB и тестирование энергопотребления.
Лаборатория была построена с учётом распространенных референсных архитектур, позволяя клиентам тестировать свои решения с SSD Solidigm в среде, использующей те же стандарты, что и крупные центры обработки данных по всему миру. Объект также ускорит исследования в области систем хранения данных, выходящие за рамки традиционного тестирования на уровне компонентов, чтобы лучше понять реальное использование на уровне сервера, стойки и кластера. Работа в лаборатории уже ведётся с несколькими организациями.
Solidigm и Metrum AI недавно продемонстрировали технику, которая перемещает данные ИИ из памяти на SSD, сокращая использование DRAM до 57% во время вывода с RAG (retrieval-augmented generation) при сохранении производительности и точности. Сотрудничество с FarmGPU также поддерживает текущие усилия по оптимизации инфраструктуры ИИ для повышения производительности и эффективности.
Источник: Solidigm










0 комментариев