Раскрыт кристалл NVIDIA GB202 «Blackwell», демонстрирующий огромную конфигурацию из 24 756 ядер CUDA

В сети появился снимок кристалла NVIDIA GB202, кремния, на котором работает RTX 5090, дающий подробную информацию о физической компоновке архитектуры «Blackwell». Аннотированные изображения, предоставленные аналитиком оборудования Курналом и генеральным менеджером ASUS China Тони Ю, сравнивают GB202 с его предшественником AD102 и описывают ключевые архитектурные компоненты. Центральная область кристалла содержит 128 МБ кэша L2 (96 МБ включено на RTX 5090), окруженного интерфейсами памяти. Восемь 64-битных контроллеров памяти поддерживают 512-битный интерфейс GDDR7, а физические интерфейсы расположены вдоль верхнего, левого и правого краев кристалла. Двенадцать кластеров обработки графики (GPC) окружают центральный кэш. Каждый GPC содержит восемь кластеров обработки текстур (TPC), при этом каждый GPC содержит 16 потоковых мультипроцессоров (SM). Полная конфигурация кристалла обеспечивает 24 576 ядер CUDA, организованных как 128 ядер на SM в 192 SM. Поскольку RTX 5090 предлагает «только» 21 760 ядер CUDA, это означает, что весь кристалл GB202 зарезервирован для графических процессоров рабочих станций.

Конструкция SM включает четыре среза, совместно использующих 128 КБ кэша L1 и четыре блока отображения текстур (TMU). Отдельные срезы SM содержат выделенные файлы регистров, кэши инструкций L0, планировщики варпов, блоки загрузки-хранения и блоки специальных функций. Центральным элементом компоновки кристалла является вертикальная полоса, содержащая компоненты обработки мультимедиа — блоки NVENC и NVDEC — идущие сверху вниз. Реализация RTX 5090 позволяет использовать три из четырех доступных кодеров NVENC и два из четырех декодеров NVDEC. Кристалл включает двенадцать блоков растрового движка/3D FF для обработки геометрии. На нижнем краю расположены интерфейс PCIe 5.0 x16 и компоненты контроллера дисплея. Несмотря на свой значительный размер, GB202 остается меньше предыдущих кристаллов NVIDIA GH100 и GV100, площадь которых превышала 814 мм². Каждый SM объединяет специализированное оборудование, включая новые ядра Tensor 5-го поколения и ядра RT 4-го поколения, в результате чего общее количество ядер кристалла составляет 192 RT, 768 ядер Tensor и 768 текстурных блоков.

Источник: ASUS China Tony Yu

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Можно делать смартфоны и планшеты на этом процессоре и наконец то использовать полноценную windows. Это отличная замена процессорам arm
  • Анон
Странно почему не 50 долларов.
  • Анон
Понимаю мощь производительность и все дела, но как черт возьми тепло отделять от камня если его прям нагрузить
  • Анон
Не предвзятость это - "Интересно, что Arc B580 проигрывает RTX 4060 в OpenCL" - где разница на невероятных 3,5 %, "но реабилитируется с НЕЗНАЧИТЕЛЬНЫМ 6%-ным преимуществом в Vulkan.". Не...
  • Анон
"Физика вышла из чата"??? Каким образом они добилис свечения точек, которые меньше четверти длины волны???
  • Анон
И теперь нельзя отключить авто обновление!!! Это жесть
  • Анон
Не знаю, я купил Cougar850 80Gold за 10К₽ и нормально
  • Анон
После всех роликов я одно понял у этой игры которую выпустят 20 мая у неё большое будущее
  • Анон
Когда они в продаже появятся? Уже как бы конец февраля, а нигде нет..
  • Анон

Смотреть все