NVIDIA представила видеокарту GeForce RTX 4090: в 4 раза быстрее, чем RTX 3090

21 сентября 2022, 11:09 / Технологии → Новости / Технологии

NVIDIA GeForce RTX 4090 — это монстр среди видеокарт следующего поколения, обеспечивающий потрясающую производительность, которая выводит игры на новый уровень. GeForce RTX 4090 — это не просто графический процессор, это флагманское предложение от команды зеленых, производительность которого в четыре раза выше, чем у его предшественника.

GeForce RTX 4090 от NVIDIA наконец-то представлена. Видеокарта предназначена для энтузиастов и геймеров, которые хотят добиться наилучшей визуальной точности, а для достижения этого вам нужен мощный графический процессор, учитывая, насколько требовательными стали игры AAA следующего поколения. Помня об этом, NVIDIA сделала свой следующий чип не на несколько процентов или 50% быстрее предыдущего поколения, а в целых 4 раза быстрее с DLSS и в 2 раза быстрее в нативном разрешении.

В основе видеокарты NVIDIA GeForce RTX 4090 лежит графический процессор Ada Lovelace

AD102. Графический процессор имеет размеры 608,4 мм2 и будет использовать технологический узел TSMC 4N, который является оптимизированной версией 5-нм узла TSMC (N5), разработанного для NVIDIA. Графический процессор оснащен безумным количеством транзисторов — 76,3 миллиардов.

Ожидается, что графический процессор NVIDIA Ada Lovelace AD103 будет содержать до 7 GPC (кластеров обработки графики). Это то же количество GPC, что и у графического процессора Ampere

GA102, и один дополнительный GPC по сравнению с графическим процессором GA103. Каждый графический процессор будет состоять из 6 TPC и 2 SM, которые имеют ту же конфигурацию, что и существующий чип. Каждый SM (потоковый мультипроцессор) будет содержать четыре подъядра, что также соответствует графическому процессору GA102. Что изменилось, так это конфигурация ядра FP32 и ядра INT32. Каждое подъядро будет включать 128 блоков FP32, но общее количество блоков FP32+INT32 увеличится до 192. Это связано с тем, что блоки FP32 не используют то же подъядро, что и блоки IN32. 128 ядер FP32 отделены от 64 ядер INT32.

Таким образом, в общей сложности каждое подъядро будет состоять из 32 блоков FP32 плюс 16 блоков INT32, в общей сложности 48 блоков. Каждый SM получит в общей сложности 128 блоков FP32 плюс 64 блока INT32, в общей сложности 192 блока. И поскольку в общей сложности имеется 84 блока SM (по 12 на GPC), мы рассматриваем 12 288 блоков FP32 и 6 144 блока INT32 для общего количества 18 432 ядер. Каждый SM также будет включать два графика обертывания (32 нити/CLK) для 64 обертываний на SM. Это на 50% больше ядер (FP32 +INT32) и на 33% больше Wraps/Threads по сравнению с графическим процессором GA102.

Блок-схема игрового графического процессора NVIDIA AD102 'Ada Lovelace' SM (Kopite7kimi):

Переход к кешу, это еще один сегмент, в котором NVIDIA значительно продвинулась по сравнению с существующими графическими процессорами Ampere. Графические процессоры Ada Lovelace будут содержать 192 КБ кэша L1 на SM, что на 50% больше, чем у Ampere. Это в общей сложности 4,5 МБ кэша L1 на топовом графическом процессоре AD102. Кэш L2 будет увеличен до 96 МБ, как упоминалось в утечках. Это в 16 раз больше по сравнению с графическим процессором Ampere, который содержит всего 6 МБ кэша L2. Кэш будет общим для всего графического процессора.

Наконец, у нас есть ROPs, которые также увеличены до 32 на GPC, что в 2 раза больше, чем в Ampere. Вы видите до 384 ROPs на флагмане следующего поколения против всего 112 на самом быстром графическом процессоре Ampere — RTX 3090 Ti. Также на графических процессорах Ada Lovelace будут установлены новейшие ядра 4-го поколения Tensor и 3-го поколения RT (Raytracing), которые помогут поднять производительность DLSS и Raytracing на новый уровень. В целом, графический процессор Ada Lovelace AD102 будет предлагать:

В 2 раза больше GPU (по сравнению с Ampere)
На 50% больше ядер (по сравнению с Ampere)
На 50% больше кэша L1 (по сравнению с Ampere)
В 16 раз больше кэша L2 (по сравнению с Ampere)
Вдвое больше ROPs (по сравнению с Ampere)
Тензорные ядра 4-го поколения и RT-ядра 3-го поколения

Официальные спецификации NVIDIA GeForce RTX 4090

NVIDIA GeForce RTX 4090 будет использовать 128 SM из 144 SM для общего количества 16 384 ядер CUDA. Графический процессор будет оснащен 96 МБ кэш-памяти L2 и в общей сложности 384 ROPs, что просто безумно, но, учитывая, что RTX 4090 имеет урезанный дизайн, он может иметь немного меньшее количество L2 и ROP. Тактовые частоты рассчитаны на частоту до 2,6 ГГц, а NVIDIA заявляет о скорости более 3 ГГц с разгоном

Что касается характеристик памяти, GeForce RTX 4090 получит емкость 24 ГБ GDDR6X, которая будет работать со скоростью 21 Гбит/с через 384-битный интерфейс шины. Это обеспечит пропускную способность до 1 ТБ/с. Это та же пропускная способность, что и у существующей видеокарты RTX 3090 Ti, а что касается потребляемой мощности, то TBP рассчитана на 450 Вт. Плата будет питаться от одного 16-контактного разъема, который обеспечивает мощность до 600 Вт. Пользовательские модели будут предлагать более высокие целевые показатели TBP.

Что касается производительности этих графических процессоров-монстров, NVIDIA поделилась показателями вычислительной и игровой производительности, и, похоже, GeForce RTX 4090 станет первой игровой картой, достигшей предела вычислительной мощности в 100 ТФЛОПс.

Просто для сравнения:

NVIDIA GeForce RTX 4090: 90 ТФЛОПс (FP32) (при тактовой частоте 2,8 ГГц)
NVIDIA GeForce RTX 3090 Ti: 40 ТФЛОПс (FP32) (тактовая частота 1,86 ГГц)
NVIDIA GeForce RTX 3090: 36 ТФЛОПс (FP32) (тактовая частота 1,69 ГГц)

Исходя из теоретической тактовой частоты 2,8 ГГц, вы получаете вычислительную производительность до 103 ТФЛОПс, а слухи предполагают еще более высокую тактовую частоту boost. Вычислительная производительность более 100 ТФЛОПс означает более чем двукратное увеличение мощности по сравнению с флагманом 3090 Ti. Но следует иметь в виду, что производительность вычислений не обязательно указывает на общую производительность в играх.

Это будет 2-кратный прирост вычислительной производительности и 2-кратный прирост игровой производительности, как продемонстрировала NVIDIA для каждой видеокарты по сравнению с её предшественницей, что даже без учета производительности RT (трассировка лучей) и ядер Tensor.

Геймерам следует ожидать, что игры в формате 4K на этих видеокартах будут воспроизводиться плавно, а с включенной DLSS можно даже получить 60 кадров в секунду при разрешении 8K. Инсайдер XpeaGPU утверждает, что на карте NVIDIA GeForce RTX 4090 удалось запустить Control в 4K, с включенной трассировкой лучей и DLSS с невероятно высокой скоростью 160 кадров в секунду.

Немалый подвиг для игры, которая печально известна тем, что ставит на колени многие графические процессоры. Однако помните, что это просочившиеся тесты, они ни в коем случае не являются официальными и результаты могут измениться по сравнению с конечным продуктом.

Теперь перейдем к ценам: видеокарты NVIDIA GeForce RTX 3090

Ti и RTX 3090, без сомнения, являются самыми дорогими однокристальными графическими процессорами на сегодняшний день. NVIDIA GeForce RTX 4090 будет продаваться по рекомендованной цене 1599 долларов (~ 96148 руб.) за версию Founders Edition и будет доступна 12 октября. Хотя реальная цена в магазинах может резко возрасти из-за проблем с доступностью новинки.

NVIDIA представила видеокарту GeForce RTX 4090: в 4 раза быстрее, чем RTX 3090

0 комментариев

Оставить комментарий

Все комментарии - Технологии