Nvidia увеличит число шейдеров в GPU RTX 50

Шейдерные ядра графического процессора, называемые на языке Nvidia

NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия

Читайте также:В 2023 году Nvidia поставила 3,76 млн графических процессоров для центров обработки данныхСтали известны возможные характеристики линейки графических процессоров NVIDIA GeForce «Blackwell»Дженсен Хуанг подписывает карту PNY RTX 4070 Super BlowerПоддержка Elden Ring Shadow of the Erdtree, новые драйверы NVIDIA Game Ready 555.99 уже доступныNvidia представила захват AV1 4K 120FPS

ядрами CUDA, и ROP являются важными аспектами современных графических процессоров. Похоже, что с предстоящей серией RTX 50 Nvidia сосредоточилась на первой, а не на обеих. Harukaze5719 сообщает на X (официально в Twitter), что будущие графические процессоры Nvidia Blackwell RTX 50-й серии увидят только улучшение количества ядер CUDA по сравнению с графическими процессорами Ada Lovelace RTX 40-й серии, при этом ROP останутся одинаковыми на разных уровнях. Единственным исключением является кристалл начального уровня GB207, у которого количество ROPS снижается на 33%.

ROP, или блоки вывода рендеринга (также конвейеры растровых операций), играют жизненно важную роль в традиционном конвейере 3D-рендеринга на графическом процессоре. Как следует из названия, они обрабатывают информацию о пикселях и текселах или, другими словами, рабочие нагрузки растеризации. ROP обычно не так важны, как шейдерные ядра, но они по-прежнему играют ключевую роль в конвейере графического процессора. Вы хотите масштабировать количество ROP относительно количества шейдерных ядер и других кластеров обработки, чтобы обеспечить оптимальную производительность.

Новая информация Harukaze (основанная на формуле популярного источника Kopite7kimi) предполагает, что Nvidia не будет добавлять больше модулей вывода рендеринга в свой игровой вариант архитектуры графического процессора Blackwell. От предположительно массового GB206 до флагманского процессора GB202, различные графические процессоры предположительно будут иметь точно такое же количество ROPS, что и их предшественники Ada Lovelace (серия RTX 40). GB207, единственное исключение, как сообщается, сделает еще один шаг вперед в сокращении количества ROPS и будет иметь снижение на 33% по сравнению с AD107.

Может показаться странным, что Nvidia не увеличила количество ROPS, но вполне вероятно, что архитекторы компании считают, что для Blackwell уже достаточно ROP. Как упоминалось ранее, ROPS не является определяющим фактором производительности графического процессора, особенно в современных рабочих нагрузках, которые включают трассировку лучей, масштабирование и другие эффекты. Увеличение ROPS не требует увеличения производительности, если архитектура становится несбалансированной. Nvidia также могла бы улучшить отдельные характеристики ROPS в Блэквелле, что могло бы дать еще одно объяснение слухам об изменениях.

Возьмем, к примеру, снижение ROPS на 33% у GB207. Предыдущий кристалл графического процессора Nvidia AD107 имеет такое же количество ROPS, что и немного больший и, следовательно, более дорогой кристалл AD106. Но, несмотря на это кажущееся преимущество, графическим процессорам на базе AD107 так и не удалось конкурировать с графическими процессорами на базе AD106. Как показал наш обзор RTX 4060, карта RTX 4060 с AD107 не уступает RTX 4060 Ti по игровой производительности. Ключевые различия между ними заключаются в количестве ядер CUDA и других вычислительных ядрах (RT, тензорных и текстурных).

Возможно, AD107 был «перегружен», и Nvidia сократит количество ROPS с GB207, потенциально увеличивая разрыв с GB206. Также похоже, что Nvidia сократит количество ядер CUDA всего до 2560 — меньше, чем 3072 на RTX 4060. Тем временем GB206 имеет до 4608 шейдеров, столько же, сколько и AD106 (но у RTX 4060 Ti было включено только 4342 ядра). Эти изменения, скорее всего, приведут к увеличению разрыва между деталями GB207 и GB206.

Говоря о ядрах CUDA, Nvidia предположительно будет иметь до 24 576 шейдеров (192 SM

Thumbnail: SM EntertainmentSM Entertainment (кор. SM엔터테인먼트) — крупнейшая развлекательная компания Южной Кореи, основана в 1995 году Ли Суманом. Компания разработала и популяризировала многочисленные звезды K-pop с огромными глобальными фэндомами. SM известен тем, что возглавил глобальное явление K-pop и музыкальную волну «Халлю», также известную как «Корейская волна». Википедия

— потоковых мультипроцессора) на своем верхнем кристалле GB202. Он также будет иметь 512-битный интерфейс памяти, который в сочетании с GDDR7

GDDR7 SDRAM (Graphics Double Data Rate 7 Synchronous Dynamic Random-Access Memory) — тип памяти графической карты (SGRAM), указанный в стандарте памяти JEDEC с высокой пропускной способностью, интерфейсом с "двойной скоростью передачи данных", предназначенным для использования в видеокартах, игровых консолях и высокопроизводительных вычислениях. Это тип GDDR SDRAM (графическая DDR SDRAM), преемник GDDR6(X/W). Википедия

Читайте также:Micron начала поставки образцов GDDR7Новые видеокарты с памятью GDDR7 появятся к концу 2024 годаSK hynix планирует создать модуль памяти GDDR7 объёмом 3 ГБ со скоростью передачи данных 40 Гбит/сSamsung представит память GDDR7 со скоростью 37 Гбит/с для видеокарт нового поколения

может значительно повысить пропускную способность памяти. GB203, с другой стороны, будет похож на текущий AD103, с до 84 SM и 10752 шейдерами по сравнению с 80 SM и 10240 ядрами CUDA на AD103, а также с тем же 256-битным интерфейсом (но с поддержкой GDDR7). Это создает огромную пропасть между потенциальными RTX 5090 и RTX 5080, если эти слухи подтвердятся.

Внизу по стеку GB205 заменяет AD104, но там, где AD104 имел до 60 SM и 7680 шейдеров, новый чип, по-видимому, будет максимально использовать 50 SM и 6400 шейдеров — и снова будет придерживаться того же 192-битного интерфейса памяти. GB206 сохранит те же 36 SM и 4608 ядер CUDA, что и его предшественник AD106, со 128-битным интерфейсом. И наконец, кристалл GB207 будет иметь только 20 SM и 2560 ядер CUDA со 128-битным интерфейсом памяти GDDR6.

Надеемся, это само собой разумеется, но читатели должны воспринимать всю предоставленную информацию с огромной долей скептицизма. Эти неофициальные данные могут появиться в результате утечки, или это могут быть просто распространители слухов, выдвигающие различные идеи, основанные на том, что имеет смысл. Согласно текущим слухам, Nvidia выпустит первые два графических процессора RTX 50-й серии ближе к концу года, но последние три кристалла выйдут не раньше 2025 года. Это оставляет достаточно времени для изменений и дальнейших спекуляций. Мы также не слышали об архитектурных изменениях потребительской Blackwell, хотя можно с уверенностью сказать, что будут обновлены ядра CUDA, Tensor и RT, а также, возможно, изменения в ROPS и других элементах.

Однако одно можно сказать наверняка: если Nvidia действительно планирует использовать 512-битный интерфейс памяти и до 192 SM с топовым решением GB202, это обойдется недешево. Непревзойденная производительность, огромная мощность и кусок вашего банковского счета размером с акулу.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон
требуется указать магазин и purchase date без этого не регистрирует
  • Анон
Россия на них клала❤❤❤❤, будет называться Ладушка 2.0 )))
  • Анон
ДА у меня тоже неработает уже все Вы не знаете каким способом вернуть все обратно СПАСИ
  • Анон
Хаетв Рустам Базарвич Хаетв
  • Анон
Очень довольна приложением. Пользуюсь сама и рекомендую другим.
16 способ - Ноутбук HP ProBook 4740s автоматически установлена камера HP HD Webcam [Fixed] при этом онлайн из браузера подключается камера к веб страницам, камера работает. С приложениями камера...
  • Анон

Смотреть все