AVX-512 увеличивает производительность эмулятора RPCS3 до 30%

ИгрыНовости / Игры

Разработчик эмулятора RPCS3 «PlayStation 3» опубликовал подробный пост, в котором подчеркивается преимущество AVX-512 на современных процессорах. Сообщение помогает нам понять, как работает AVX-512 и чем технология полезна для эмулятора и для тех, кто хочет получить дополнительную производительность в играх PlayStation 3 на ПК.

Пост был опубликован Whatcookie — одним из многих разработчиков проекта эмулятора RPCS3. В нем он объясняет, как AVX-512 помогает повысить производительность RPCS3 по сравнению со стандартными инструкциями AVX2.

Для тестирования использовался процессор Intel Core i9-12900K на частоте 5,2 ГГц с включенным AVX-512. Используя стандартные инструкции SSE2, игра показала только 5 кадров в секунду, а переход на SSE 4.1 дал огромный прирост 160 кадров в секунду. Утверждается, что причина этого связана с отсутствием инструкций SSSE3, которые необходимы для эмулятора PlayStation 3.

Переходя на AVX2/FMA, вы получаете дополнительный прирост производительности на 13%, а переходя с AVX2 на AVX-512, вы получаете прирост производительности на 30% до 242 кадров в секунду.

SSE4.1 достигает в среднем 160 кадров в секунду, тогда как AVX2/FMA достигает в среднем 190 кадров в секунду. Это на 18% больше, чем у цели SSE4.1. AVX2 не включает много новых инструкций по сравнению с SSE4.1, но включает новую форму инструкций с 3 операндами, которая устраняет необходимость в большом количестве регистров для регистрации mov-инструкций. Важно отметить, что все процессоры, поддерживающие AVX2, также поддерживают инструкции FMA. Инструкции FMA не только быстрее, чем цепочка инструкций умножения + сложения, но также могут давать разные результаты из-за отсутствия округления до одинарной точности между умножением и сложением. Точная эмуляция этого без инструкций FMA добавляет некоторые накладные расходы, поэтому собственные операции FMA немного помогают.

Целевой уровень Icelake AVX-512 достигает средних 235 кадров в секунду, что на 23% быстрее, чем целевой показатель AVX2/FMA. Огромное количество новых инструкций, добавленных в AVX-512, настолько велико, что многие из них оказываются полезными для RPCS3. В отличие от AVX2, который был в основном прямым расширением существующих инструкций SSE до 256 бит, AVX-512 включает в себя огромное количество новых функций, которые очень полезны для программирования SIMD, даже при меньшей разрядности. Однако, поскольку Intel решила продавать AVX-512 под псевдонимом -512, люди, не знакомые с набором инструкций, обычно зацикливаются на 512-битном векторном аспекте набора инструкций.

Хотя Intel отказывается от поддержки AVX-512 в своих процессорах Alder Lake 12-го поколения, мы увидели потенциал производительности, и похоже, что недавно анонсированная линейка процессоров AMD Zen 4 «Ryzen 7000» может извлечь из этого большое преимущество. Архитектура ядра Zen 4 будет поддерживать AVX-512, и если появится преемник Steam Deck или различных других портативных консолей, использующих процессоры следующего поколения, мы можем увидеть, как несколько пользователей воспользуются набором инструкций для имитации старых игр с действительно хорошей производительностью.

Подписаться на обновления Новости / Игры

Лучший рейтинг за неделю

0 комментариев

Оставить комментарий