Nvidia анонсировала выпуск GPU Rubin и Rubin Ultra
NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия
Читайте также:Спрос на RTX Pro Blackwell с 96 ГБ видеопамятиNVIDIA анонсирует платформу Blackwell Ultra для искусственного интеллекта следующего поколенияNvidia выпустила новые коммутационные платформы на 400 Тбит/сBOXX обновил рабочие станции новыми GPU NVIDIA RTX PRONVIDIA развивает науку и технику с CUDA-X
Блэкуэлл, Блэквелл (англ. Blackwell) — английская фамилия. Википедия
Читайте также:Спрос на RTX Pro Blackwell с 96 ГБ видеопамятиNVIDIA анонсирует платформу Blackwell Ultra для искусственного интеллекта следующего поколенияBOXX обновил рабочие станции новыми GPU NVIDIA RTX PRONVIDIA выпускает профессиональные видеокарты серии RTX PRO 6000 BlackwellМини-суперкомпьютер Asus использует чип Nvidia Grace Blackwell для 1000 TOPS AI
Одним из интересных моментов является то, что «Blackwell был назван неправильно». Короче говоря, Blackwell B200 на самом деле имеет два кристалла на GPU, что, по словам Дженсена, меняет топологию NVLink. Поэтому, хотя он называет текущее решение Blackwell B200 NVL72, он говорит, что было бы более уместно назвать его NV144L. Именно это Nvidia и сделает с будущими решениями Rubin.
(Изображение предоставлено: Nvidia)
(Изображение предоставлено: Nvidia)
Выше у нас есть стойка Rubin NVL144, которая будет совместима с существующей инфраструктурой Blackwell NVL72. У нас есть те же данные конфигурации для Blackwell Ultra B300 NVL72 на втором слайде для сравнения. Там, где B300 NVL72 предлагает 1,1 PFLOPS плотных вычислений FP4, Rubin NVL144 — это с теми же 144 кристаллами GPU — предложит 3,6 PFLOPS плотных FP4. Rubin также получит 1,2 ExaFLOPS обучения FP8 по сравнению с всего лишь 0,36 ExaFLOPS для B300. В целом, это улучшение производительности вычислений в 3,3 раза.
Rubin также ознаменует переход от HBM3/HBM3e к HBM4, при этом HBM4e будет использоваться для Rubin Ultra. Объем памяти останется на уровне 288 ГБ на GPU, как и в B300, но пропускная способность увеличится с 8 ТБ/с до 13 ТБ/с. Также будет более быстрый NVLink, который удвоит пропускную способность до 260 ТБ/с, и новое соединение CX9 между стойками с 28,8 ТБ/с (вдвое больше пропускной способности B300 и CX8).
Другая половина семейства Rubin будет процессором Vera, который заменит текущие процессоры Grace. Vera будет относительно небольшим и компактным процессором с 88 ядрами ARM и 176 потоками. Он также получит интерфейс NVLink core-to-core со скоростью 1,8 ТБ/с для связи с графическими процессорами Rubin.
Rubin Ultra выйдет во второй половине 2027 года, и хотя процессор Vera останется, графическая составляющая получит еще один мощный импульс. Полная стойка будет заменена новой компоновкой NVL576. Да, это до 576 графических процессоров в стойке, каждый с неопределенным энергопотреблением.
Вывод вычислений с FP4 взлетит до 15 ExaFLOPS, с 5 ExaFLOPS вычислений обучения FP8. Это примерно в 4 раза больше вычислений Rubin NVL144, что имеет смысл, учитывая, что в нем также в четыре раза больше графических процессоров. На этот раз графические процессоры получат четыре кристалла GPU на пакет, чтобы повысить плотность вычислений.
В то время как решение NVL144 Rubin имеет 75 ТБ в общей сложности «быстрой памяти» (как для ЦП, так и для ГП) на стойку, Rubin Ultra NVL576 предложит 365 ТБ памяти. Графические процессоры получат HBM4e, но здесь все немного любопытно. Nvidia указывает 4,6 ПБ/с пропускной способности HBM4e, но с 576 ГП это составляет 8 ТБ/с на ГП. Это, по-видимому, меньше пропускной способности на ГП, чем раньше, но, возможно, это фактор того, как четыре кристалла ГП связаны между собой. Также будет 1 ТБ HBM4e на четыре ГП размером с сетку, с 100 петафлопс вычислений FP4.
Интерфейс NVLink7 будет в 6 раз быстрее, чем на Rubin, с пропускной способностью 1,5 ПБ/с. Соединения CX9 также получат 4-кратное улучшение до 115,2 ТБ/с между стойками — возможно, за счет увеличения числа соединений в четыре раза.
Очевидно, что мы еще многого не знаем о Rubin и Rubin Ultra, но эти детали будут конкретизированы в будущем. Центры обработки данных требуют гораздо большего планирования, чем потребительские GPU, поэтому Nvidia поделилась всеми подробностями задолго до того, как продукты будут готовы к отправке. И это еще не все...
Изображение: Nvidia
После Рубина следующая архитектура дата-центров Nvidia будет названа в честь физика-теоретика Ричарда Фейнмана. Предположительно, это означает, что мы получим процессоры Ричарда с графическими процессорами Фейнмана, если Nvidia продолжит следовать текущему шаблону.
Источник: Tomshardware.com
0 комментариев