Kioxia разработала прототип модуля флеш-памяти 5 ТБ с пропускной способностью 64 ГБ/с для ИИ-ускорителей

Компания Kioxia представила прототип высокоскоростного модуля флеш-памяти объёмом 5 ТБ с пропускной способностью 64 ГБ/с. Эта разработка, получившая название High Bandwidth Flash (HBF), по сути представляет собой память на основе NAND для GPU. По сравнению с HBM, HBF адаптирует концепцию для NAND-флеш, предлагая в 8-16 раз большую ёмкость, чем DRAM-based HBM. Сочетая скорость с постоянным хранением данных, HBF позволяет эффективно работать с большими наборами данных ИИ при меньшем энергопотреблении.

Когда вы слышите «флеш-накопитель», вы обычно думаете сначала о ёмкости, а потом о скорости. Даже самые быстрые сегодняшние SSD PCIe 5.0 — диски класса 14 ГБ/с, такие как Samsung 9100 Pro, — меркнут по сравнению с требованиями к пропускной способности современных GPU и CPU. Новый прототип Kioxia переворачивает эти ожидания: один модуль флеш-памяти предлагает 5 ТБ ёмкости и 64 ГБ/с устойчивой пропускной способности по PCIe 6.0. Для сравнения, это более чем в 4 раза быстрее, чем самые скоростные PCIe 5.0 накопители, доступные сегодня, и близко к пропускной способности HBM2E на стек.

Ключевой момент — масштабируемость системы; вместо одного центрального контроллера, пытающегося управлять всем банком NAND — что быстро становится узким местом при добавлении большего количества кристаллов и каналов — Kioxia оснащает каждый модуль собственным контроллером. Этот контроллер расположен прямо рядом со своим NAND и соединяется с другими по цепочке (daisy-chain). Это уменьшает перекрёстные помехи и устраняет сложность широких параллельных шин, управление которыми становится всё более сложным по мере роста скоростей. Вместо этого данные передаются последовательно, с каждой связью, передающей 128 Гбит/с с использованием сигнализации PAM4.

PAM4 (импульсно-амплитудная модуляция с четырьмя уровнями) удваивает скорость передачи данных на символ по сравнению с традиционной сигнализацией NRZ, но она также более чувствительна к шумам и ошибкам битов. Для поддержания целостности сигнала Kioxia полагается на эквализацию, коррекцию ошибок и более сильный предыскажения — аналогично тому, что требует сам PCIe 6.0.

Это помогает объяснить переход на PCIe 6.0 в качестве интерфейса хоста, поскольку 16 линий PCIe 6.0 теоретически могут обрабатывать около 128 ГБ/с в двунаправленном режиме. Целевой показатель Kioxia в 64 ГБ/с находится чуть ниже половины этого лимита, оставляя достаточный запас для коррекции ошибок и накладных расходов без полной загрузки шины.

Как вы могли ожидать, основным компромиссом является задержка. Память HBM работает в сотнях наносекунд, почти как расширение регистров GPU. NAND флеш — даже с продвинутыми контроллерами — всё ещё обращается к данным за десятки микросекунд, что на порядки медленнее. Kioxia противодействует этому с помощью агрессивного предварительного чтения (prefetching) и кэширования на уровне контроллера, поэтому последовательные рабочие нагрузки меньше страдают. Это не делает NAND таким же быстрым, как DRAM, но достаточно сокращает разрыв, чтобы для потоковых наборов данных, контрольных точек ИИ или анализа больших графов пропускная способность имела большее значение, чем чистая задержка.

Энергопотребление — ещё один ключевой фактор: Kioxia заявляет о потреблении менее 40 Вт на модуль, что впечатляет по сравнению с традиционными SSD Gen5, которые могут потреблять до 15 Вт для ~14 ГБ/с. С точки зрения ГБ/с на Ватт этот модуль значительно эффективнее. Это важно, потому что в гипермасштабной стойке несколько сотен накопителей могут легко потреблять несколько киловатт. Центрам обработки данных для ИИ — уже раздувающим бюджеты энергопотребления из-за кластеров на H100 — нужна экономия каждого ватта на уровне хранения.

Эти модули также открывают новые варианты проектирования систем. С контроллерами, соединёнными по цепочке, добавление большего количества модулей не потребляет дополнительную пропускную способность, поэтому производительность масштабируется линейно с ёмкостью. Полный набор из 16 модулей может достигать 80 ТБ флеш-памяти и более 1 ТБ/с пропускной способности — цифры, которые раньше были ограничены параллельными файловыми системами или блоками оперативной памяти. Это позволяет рассматривать хранилище как почти-память, расположенную непосредственно на шине PCIe вместе с ускорителями, а не застрявшую в backend I/O.

Это не первое погружение Kioxia в высокоскоростную флеш-память. Компания экспериментировала с SSD на PCIe с большой дальностью связи и прямыми связями флеш-памяти с GPU, включая исследования с Nvidia по дискам XL-Flash, настроенным на 10 миллионов IOPS. В сочетании с недавно анонсированным расширением производственных мощностей в Японии — движимым ожиданием, что спрос на флеш-память почти утроится к 2028 году — становится ясно, что этот прототип не разовая акция. Это намёк на дорожную карту, где NAND не просто становится больше, но и быстрее, достаточно быстрой, чтобы располагаться ближе к вычислительному стеку.

Пока модуль остаётся на стадии прототипа, и есть неотвеченные вопросы: как он справляется со смешанными случайными рабочими нагрузками, как масштабирование ECC влияет на задержку и какова реальная пропускная способность в условиях обучения ИИ. Однако более важное сообщение здесь в том, что флеш-память вырывается из своей роли медленного, глубокого хранилища и движется вверх по иерархии. Если видение Kioxia (как изложено в их пресс-релизе) оправдается, следующее поколение центров обработки данных может увидеть, как модули хранения будут соревноваться за права хвастовства пропускной способностью наравне с самими GPU.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии