Раскрыт кристалл NVIDIA GB202 «Blackwell», демонстрирующий огромную конфигурацию из 24 756 ядер CUDA

В сети появился снимок кристалла NVIDIA GB202, кремния, на котором работает RTX 5090, дающий подробную информацию о физической компоновке архитектуры «Blackwell». Аннотированные изображения, предоставленные аналитиком оборудования Курналом и генеральным менеджером ASUS China Тони Ю, сравнивают GB202 с его предшественником AD102 и описывают ключевые архитектурные компоненты. Центральная область кристалла содержит 128 МБ кэша L2 (96 МБ включено на RTX 5090), окруженного интерфейсами памяти. Восемь 64-битных контроллеров памяти поддерживают 512-битный интерфейс GDDR7, а физические интерфейсы расположены вдоль верхнего, левого и правого краев кристалла. Двенадцать кластеров обработки графики (GPC) окружают центральный кэш. Каждый GPC содержит восемь кластеров обработки текстур (TPC), при этом каждый GPC содержит 16 потоковых мультипроцессоров (SM). Полная конфигурация кристалла обеспечивает 24 576 ядер CUDA, организованных как 128 ядер на SM в 192 SM. Поскольку RTX 5090 предлагает «только» 21 760 ядер CUDA, это означает, что весь кристалл GB202 зарезервирован для графических процессоров рабочих станций.

Конструкция SM включает четыре среза, совместно использующих 128 КБ кэша L1 и четыре блока отображения текстур (TMU). Отдельные срезы SM содержат выделенные файлы регистров, кэши инструкций L0, планировщики варпов, блоки загрузки-хранения и блоки специальных функций. Центральным элементом компоновки кристалла является вертикальная полоса, содержащая компоненты обработки мультимедиа — блоки NVENC и NVDEC — идущие сверху вниз. Реализация RTX 5090 позволяет использовать три из четырех доступных кодеров NVENC и два из четырех декодеров NVDEC. Кристалл включает двенадцать блоков растрового движка/3D FF для обработки геометрии. На нижнем краю расположены интерфейс PCIe 5.0 x16 и компоненты контроллера дисплея. Несмотря на свой значительный размер, GB202 остается меньше предыдущих кристаллов NVIDIA GH100 и GV100, площадь которых превышала 814 мм². Каждый SM объединяет специализированное оборудование, включая новые ядра Tensor 5-го поколения и ядра RT 4-го поколения, в результате чего общее количество ядер кристалла составляет 192 RT, 768 ядер Tensor и 768 текстурных блоков.

Источник: ASUS China Tony Yu

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

После всех роликов я одно понял у этой игры которую выпустят 20 мая у неё большое будущее
  • Анон
Когда они в продаже появятся? Уже как бы конец февраля, а нигде нет..
  • Анон
Поддерживаю. А еще если брать в разрезе Илон Маск и безопасность данных, то вообще смешно. Особенно для жителей РФ)О конфиденциальности можно забыть
  • Анон
1c пох на ваши операции, количество ядер и прочее. Умудрились написать ядро четко привязанное к Мгц. Единственный в мире продукт для 1го ядра.
  • Анон
Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон
требуется указать магазин и purchase date без этого не регистрирует
  • Анон

Смотреть все