NVIDIA представила Blackwell Ultra GB300 — самый быстрый в мире ИИ-чип с 208 миллиардами транзисторов
NVIDIA официально представила детали своего самого мощного чипа для искусственного интеллекта — Blackwell Ultra GB300. Этот чип на 50% быстрее GB200, а его технические характеристики впечатляют даже на фоне предыдущих поколений.
GB300 использует конструкцию Dual Reticle GPU, то есть двух соединённых матриц, которые благодаря интерфейсу NV-HBI (10 ТБ/с) работают как единый чип. Чип создан по процессу TSMC 4NP (усовершенствованный 5 нм для NVIDIA) и состоит из 208 миллиардов транзисторов.
Внутри мы найдём:
– 160 потоковых мультипроцессоров (SM),
– 20480 ядер CUDA,
– 640 ядер Tensor 5-го поколения с поддержкой FP8, FP6 и NVFP4,
– 40 МБ памяти TMEM.
Именно ядра Tensor отвечают за революцию в производительности ИИ — от Volta до Blackwell каждое поколение приносило новые режимы вычислений, а GB300 удваивает возможности предшественников. Самый большой скачок касается памяти — 288 ГБ HBM3e (в 8 стеках), с шиной 8192 бит и пропускной способностью 8 ТБ/с. Это позволит запускать модели ИИ, насчитывающие сотни миллиардов параметров, без необходимости использования внешней памяти и увеличивает производительность трансформеров благодаря большему кэшу KV.
– Производительность FP8: 5 PFLOPS (dense), 10 PFLOPS (sparse),
– Производительность NVFP4: 15 PFLOPS (dense), 20 PFLOPS (sparse),
– NVLink 5: 1,8 ТБ/с на GPU (18 x 100 ГБ/с),
– PCIe Gen6 x16: 256 ГБ/с,
– Масштабирование: до 576 GPU в одной топологии и конфигурации NVL72 (72 GPU) с общей пропускной способностью 130 ТБ/с.
GB300 не только ускоряет вычисления, но и предлагает новые функции корпоративного класса:
– MIG (Multi-Instance GPU): разделение GPU на независимые экземпляры (например, 2 x 140 ГБ, 4 x 70 ГБ, 7 x 34 ГБ),
– Confidential Computing: защита моделей ИИ в аппаратном TEE с шифрованием NVLink,
– AI-driven RAS: мониторинг тысяч параметров и прогнозирование сбоев,
– GigaThread Engine нового поколения — ещё более быстрое управление задачами.
Blackwell Ultra GB300 показывает, что NVIDIA не намерена уступать лидерские позиции. Чип уже производится массово и поступает к крупнейшим игрокам на рынке ИИ. Благодаря огромной памяти, модульной архитектуре и улучшениям в ядрах Tensor, GB300 должен поддерживать модели с триллионами параметров и задать новый стандарт в вычислениях искусственного интеллекта.
Хотя на первый взгляд может показаться, что мощные чипы вроде Blackwell Ultra GB300 касаются исключительно центров обработки данных и исследований в области ИИ, на практике они имеют огромное значение и для геймеров. Именно благодаря инвестициям NVIDIA в ИИ-инфраструктуру создаются такие технологии, как DLSS (Deep Learning Super Sampling) или RTX Video Super Resolution, которые используют алгоритмы искусственного интеллекта для повышения качества изображения и производительности в играх. Чем более мощные ИИ-чипы NVIDIA поставляет разработчикам, тем быстрее эти решения попадают на потребительский рынок — в виде видеокарт GeForce и сервисов вроде GeForce NOW. Другими словами, Blackwell Ultra — это не только фундамент для моделей с «триллионами параметров» в дата-центрах, но и основа для следующего поколения инструментов, которые реально улучшат комфорт игры на ПК и консолях.
0 комментариев