Kioxia представила сверхбыстрый SSD для ускорения ИИ-задач на GPU Nvidia
Компании Nvidia и Kioxia объявили о совместной разработке нового SSD, который позволит графическим процессорам Nvidia для ИИ работать без простоев при интенсивных вычислениях. Как сообщает Kioxia, новый накопитель серии E3.S CM9, классифицируемый как «сверхвысокоскоростной» (Super High IOPS), предлагает ёмкость 25,6 ТБ и способен полностью перезаписываться три раза в день на протяжении всего гарантийного срока. Новинка станет доступна для оценки заказчикам к концу 2026 года.
Этот накопитель — часть совместной инициативы Kioxia и Nvidia по внедрению исключительно быстрой памяти для ИИ-ускорителей. Серия CM9 использует технологию XL-flash от Kioxia, разработанную для достижения более 10 миллионов операций ввода-вывода в секунду (IOPS). Этот показатель примерно в три-четыре раза выше, чем у традиционных серверных SSD. XL-Flash создана на базе SLC NAND (самого быстрого типа флеш-памяти) с задержкой чтения всего 3–5 микросекунд. Для сравнения, обычные SSD имеют пиковую производительность на уровне 3–4 млн IOPS и задержки чтения в диапазоне 40–100 микросекунд.
Эти новые накопители являются частью архитектуры Storage-Next от Nvidia, в рамках которой серверы используют их в связке с прямым подключением к самому графическому процессору, минуя дополнительные задержки при передаче данных через ЦП. Эта технология призвана компенсировать ограничения существующей памяти HBM, предоставляя ИИ-ускорителям Nvidia дополнительный кэш-слой для хранения данных. Это позволяет ядрам GPU работать на 100% без простоев, что решает растущую проблему масштабирования ИИ-моделей до триллионов параметров и контекстных окон, состоящих из миллионов токенов.
Впервые эту технологию представили в рамках архитектуры хранения данных BlueField-4 STX на конференции GTC 2026. BlueField-4 использует оптимизированный для задач хранения DPU BlueField-4 и суперсетевой адаптер ConnectX-9 SuperNIC. По заявлениям Nvidia, это решение обеспечивает до пятикратного увеличения пропускной способности обработки токенов, четырёхкратное улучшение энергоэффективности и удвоенную скорость загрузки данных по сравнению с традиционными архитектурами хранения на базе ЦП.
Источник: Tomshardware.com







0 комментариев