NVIDIA анонсировала Blackwell Ultra с поддержкой PCIe 6.0 и мощностью до 1400 Вт
NVIDIA готовит обновлённую версию своих GPU Blackwell под названием Blackwell Ultra, которая включает модели B300 и GB300. Эти решения, как и их предшественники, ориентированы на области искусственного интеллекта и высокопроизводительных вычислений. Ожидается, что новинки появятся на рынке в конце этого года, после чего компания представит следующее поколение архитектуры «Rubin».
Blackwell Ultra сохраняет производство по 4NP-техпроцессу TSMC с 208 миллиардами транзисторов. Чип состоит из двух кристаллов, соединённых через высокоскоростной интерфейс NV-HBI с пропускной способностью 10 ТБ/с. Конфигурация включает 160 SM-блоков (каждый с 128 ядрами CUDA), 640 тензорных ядер пятого поколения и общий кэш второго уровня с полной когерентностью.
Межчиповое соединение GPU-GPU осуществляется через NVLink пятого поколения с пропускной способностью 1,8 ТБ/с, а связь GPU-CPU — через канал NVLink-C2C на 900 ГБ/с. Эти характеристики остаются без изменений.
Ключевым нововведением стало то, что Blackwell Ultra впервые получит поддержку PCIe 6.0, что удваивает доступную пропускную способность. Также объём памяти HBM3E увеличится с 192 ГБ до 288 ГБ (при пропускной способности 8 ТБ/с). Однако за эти улучшения приходится платить: максимальное энергопотребление возрастёт с 1200 Вт до 1400 Вт.
Судя по описанию NVIDIA, сама архитектура Blackwell изначально поддерживала PCIe 6.0, но эта функция до сих пор не была активирована.
В плане производительности отмечается значительный рост: показатели NVFP4 dense (плотные вычисления) увеличились на 50%, достигнув 15 Петафлопс, в то время как производительность sparse (разрежённых вычислений) осталась на уровне 20 Петафлопс.
Кроме того, способность ускорения внимания (attention acceleration) в блоке SFU (специальных функций) в конфигурации EX2 возросла с 5 ТФлопс до 10,7 ТФлопс, что более чем в два раза.
Производительность в форматах данных FP8, FP16 и TF16 осталась практически без изменений.
Основной формат развёртывания Blackwell Ultra — серверы GB300 NV72 в стойках с жидкостным охлаждением. Каждый узел по-прежнему будет содержать два GPU B300 и один процессор Grace.
Новые решения NVIDIA продолжат доминировать в сегменте высокопроизводительных вычислений и ИИ, предлагая существенный прирост производительности ценой повышенного энергопотребления. Это особенно актуально для тренировки больших языковых моделей и сложных научных симуляций.
0 комментариев