Nvidia увеличит число шейдеров в GPU RTX 50
NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия
Читайте также:В 2023 году Nvidia поставила 3,76 млн графических процессоров для центров обработки данныхСтали известны возможные характеристики линейки графических процессоров NVIDIA GeForce «Blackwell»Дженсен Хуанг подписывает карту PNY RTX 4070 Super BlowerПоддержка Elden Ring Shadow of the Erdtree, новые драйверы NVIDIA Game Ready 555.99 уже доступныNvidia представила захват AV1 4K 120FPS
Читайте также:Стали известны возможные характеристики линейки графических процессоров NVIDIA GeForce «Blackwell»Илон Маск хочет купить 300 тыс. графических процессоров Nvidia Blackwell B200 AI для Grok от XNvidia Rubin объявлена преемницей Blackwell, появится также мощный процессор VeraDell выпустит восьмипроцессорный сервер на чипах Nvidia BlackwellПодробное описание архитектур AMD Zen 5, Nvidia Blackwell и Intel Lunar Lake, которые будут представлены на выставке Hot Chips 2024
ROP, или блоки вывода рендеринга (также конвейеры растровых операций), играют жизненно важную роль в традиционном конвейере 3D-рендеринга на графическом процессоре. Как следует из названия, они обрабатывают информацию о пикселях и текселах или, другими словами, рабочие нагрузки растеризации. ROP обычно не так важны, как шейдерные ядра, но они по-прежнему играют ключевую роль в конвейере графического процессора. Вы хотите масштабировать количество ROP относительно количества шейдерных ядер и других кластеров обработки, чтобы обеспечить оптимальную производительность.
Новая информация Harukaze (основанная на формуле популярного источника Kopite7kimi) предполагает, что Nvidia не будет добавлять больше модулей вывода рендеринга в свой игровой вариант архитектуры графического процессора Blackwell. От предположительно массового GB206 до флагманского процессора GB202, различные графические процессоры предположительно будут иметь точно такое же количество ROPS, что и их предшественники Ada Lovelace (серия RTX 40). GB207, единственное исключение, как сообщается, сделает еще один шаг вперед в сокращении количества ROPS и будет иметь снижение на 33% по сравнению с AD107.
Может показаться странным, что Nvidia не увеличила количество ROPS, но вполне вероятно, что архитекторы компании считают, что для Blackwell уже достаточно ROP. Как упоминалось ранее, ROPS не является определяющим фактором производительности графического процессора, особенно в современных рабочих нагрузках, которые включают трассировку лучей, масштабирование и другие эффекты. Увеличение ROPS не требует увеличения производительности, если архитектура становится несбалансированной. Nvidia также могла бы улучшить отдельные характеристики ROPS в Блэквелле, что могло бы дать еще одно объяснение слухам об изменениях.
Возьмем, к примеру, снижение ROPS на 33% у GB207. Предыдущий кристалл графического процессора Nvidia AD107 имеет такое же количество ROPS, что и немного больший и, следовательно, более дорогой кристалл AD106. Но, несмотря на это кажущееся преимущество, графическим процессорам на базе AD107 так и не удалось конкурировать с графическими процессорами на базе AD106. Как показал наш обзор RTX 4060, карта RTX 4060 с AD107 не уступает RTX 4060 Ti по игровой производительности. Ключевые различия между ними заключаются в количестве ядер CUDA и других вычислительных ядрах (RT, тензорных и текстурных).
Возможно, AD107 был «перегружен», и Nvidia сократит количество ROPS с GB207, потенциально увеличивая разрыв с GB206. Также похоже, что Nvidia сократит количество ядер CUDA всего до 2560 — меньше, чем 3072 на RTX 4060. Тем временем GB206 имеет до 4608 шейдеров, столько же, сколько и AD106 (но у RTX 4060 Ti было включено только 4342 ядра). Эти изменения, скорее всего, приведут к увеличению разрыва между деталями GB207 и GB206.
SM Entertainment (кор. SM엔터테인먼트) — крупнейшая развлекательная компания Южной Кореи, основана в 1995 году Ли Суманом. Компания разработала и популяризировала многочисленные звезды K-pop с огромными глобальными фэндомами. SM известен тем, что возглавил глобальное явление K-pop и музыкальную волну «Халлю», также известную как «Корейская волна». Википедия
GDDR7 SDRAM (Graphics Double Data Rate 7 Synchronous Dynamic Random-Access Memory) — тип памяти графической карты (SGRAM), указанный в стандарте памяти JEDEC с высокой пропускной способностью, интерфейсом с "двойной скоростью передачи данных", предназначенным для использования в видеокартах, игровых консолях и высокопроизводительных вычислениях. Это тип GDDR SDRAM (графическая DDR SDRAM), преемник GDDR6(X/W). Википедия
Читайте также:Micron начала поставки образцов GDDR7Новые видеокарты с памятью GDDR7 появятся к концу 2024 годаSK hynix планирует создать модуль памяти GDDR7 объёмом 3 ГБ со скоростью передачи данных 40 Гбит/сSamsung представит память GDDR7 со скоростью 37 Гбит/с для видеокарт нового поколения
Внизу по стеку GB205 заменяет AD104, но там, где AD104 имел до 60 SM и 7680 шейдеров, новый чип, по-видимому, будет максимально использовать 50 SM и 6400 шейдеров — и снова будет придерживаться того же 192-битного интерфейса памяти. GB206 сохранит те же 36 SM и 4608 ядер CUDA, что и его предшественник AD106, со 128-битным интерфейсом. И наконец, кристалл GB207 будет иметь только 20 SM и 2560 ядер CUDA со 128-битным интерфейсом памяти GDDR6.
Надеемся, это само собой разумеется, но читатели должны воспринимать всю предоставленную информацию с огромной долей скептицизма. Эти неофициальные данные могут появиться в результате утечки, или это могут быть просто распространители слухов, выдвигающие различные идеи, основанные на том, что имеет смысл. Согласно текущим слухам, Nvidia выпустит первые два графических процессора RTX 50-й серии ближе к концу года, но последние три кристалла выйдут не раньше 2025 года. Это оставляет достаточно времени для изменений и дальнейших спекуляций. Мы также не слышали об архитектурных изменениях потребительской Blackwell, хотя можно с уверенностью сказать, что будут обновлены ядра CUDA, Tensor и RT, а также, возможно, изменения в ROPS и других элементах.
Однако одно можно сказать наверняка: если Nvidia действительно планирует использовать 512-битный интерфейс памяти и до 192 SM с топовым решением GB202, это обойдется недешево. Непревзойденная производительность, огромная мощность и кусок вашего банковского счета размером с акулу.
Источник: Tomshardware.com
0 комментариев