Раскрыт кристалл NVIDIA GB202 «Blackwell», демонстрирующий огромную конфигурацию из 24 756 ядер CUDA

В сети появился снимок кристалла NVIDIA GB202, кремния, на котором работает RTX 5090, дающий подробную информацию о физической компоновке архитектуры «Blackwell». Аннотированные изображения, предоставленные аналитиком оборудования Курналом и генеральным менеджером ASUS China Тони Ю, сравнивают GB202 с его предшественником AD102 и описывают ключевые архитектурные компоненты. Центральная область кристалла содержит 128 МБ кэша L2 (96 МБ включено на RTX 5090), окруженного интерфейсами памяти. Восемь 64-битных контроллеров памяти поддерживают 512-битный интерфейс GDDR7, а физические интерфейсы расположены вдоль верхнего, левого и правого краев кристалла. Двенадцать кластеров обработки графики (GPC) окружают центральный кэш. Каждый GPC содержит восемь кластеров обработки текстур (TPC), при этом каждый GPC содержит 16 потоковых мультипроцессоров (SM). Полная конфигурация кристалла обеспечивает 24 576 ядер CUDA, организованных как 128 ядер на SM в 192 SM. Поскольку RTX 5090 предлагает «только» 21 760 ядер CUDA, это означает, что весь кристалл GB202 зарезервирован для графических процессоров рабочих станций.

Конструкция SM включает четыре среза, совместно использующих 128 КБ кэша L1 и четыре блока отображения текстур (TMU). Отдельные срезы SM содержат выделенные файлы регистров, кэши инструкций L0, планировщики варпов, блоки загрузки-хранения и блоки специальных функций. Центральным элементом компоновки кристалла является вертикальная полоса, содержащая компоненты обработки мультимедиа — блоки NVENC и NVDEC — идущие сверху вниз. Реализация RTX 5090 позволяет использовать три из четырех доступных кодеров NVENC и два из четырех декодеров NVDEC. Кристалл включает двенадцать блоков растрового движка/3D FF для обработки геометрии. На нижнем краю расположены интерфейс PCIe 5.0 x16 и компоненты контроллера дисплея. Несмотря на свой значительный размер, GB202 остается меньше предыдущих кристаллов NVIDIA GH100 и GV100, площадь которых превышала 814 мм². Каждый SM объединяет специализированное оборудование, включая новые ядра Tensor 5-го поколения и ядра RT 4-го поколения, в результате чего общее количество ядер кристалла составляет 192 RT, 768 ядер Tensor и 768 текстурных блоков.

Источник: ASUS China Tony Yu

Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий