Проблемы с производительностью RTX 50
PassMark Software выявила основную причину неожиданно низкой производительности вычислений в новых графических процессорах GeForce RTX 5090, RTX 5080 и RTX 5070 Ti от NVIDIA. Виновник: NVIDIA молча прекратила поддержку 32-битного OpenCL и CUDA в своей архитектуре «Blackwell», что привело к проблемам совместимости с существующими инструментами и приложениями для бенчмаркинга. Проблема проявилась, когда тест DirectCompute от PassMark вернул код ошибки «CL_OUT_OF_RESOURCES (-5)» на картах серии RTX 5000. После расследования разработчики подтвердили, что, хотя основное приложение теста было 64-битным в течение многих лет, несколько дополнительных тестов вычислений по-прежнему используют 32-битный код, который ранее корректно работал на RTX 4000 и более ранних графических процессорах. Это архитектурное изменение не было четко задокументировано NVIDIA, чей веб-сайт для разработчиков продолжает отображать примеры 32-битного кода и документацию, несмотря на фактическое удаление поддержки.
Влияние выходит за рамки программного обеспечения для бенчмаркинга. Приложения, созданные на основе устаревшей инфраструктуры CUDA, включая такие технологии, как PhysX, будут испытывать значительное снижение производительности, поскольку вычислительные задачи возвращаются к обработке ЦП, а не к использованию параллельной архитектуры ГП. Хотя этот механизм отката позволяет старым приложениям работать на серии RTX 40 и предыдущем оборудовании, серия RTX 5000 обрабатывает эти задачи исключительно через ЦП, что приводит к существенному снижению производительности. PassMark в настоящее время работает над переносом затронутого кода OpenCL на 64-битную версию, что позволит должным образом протестировать вычислительные возможности новых ГП. Однако они предупреждают, что многие существующие приложения, содержащие 32-битные компоненты OpenCL, могут никогда не работать должным образом на картах серии RTX 5000 без изменений исходного кода. Разработчик бенчмарка также отмечает, что это изменение не полностью объясняет низкую производительность DirectX9, предполагая, что дополнительные архитектурные изменения могут повлиять на устаревшие пути рендеринга. PassMark обновил свое программное обеспечение сегодня, но устаревшие бенчмарки все еще могут пострадать. Ниже приведен старый бенчмарк-прогон без последних исправлений PassMark V11.1 build 1004, показывающий, насколько хуже обстоят дела с новейшими поколениями без надлежащей программной поддержки.
Источник: PassMark on X








0 комментариев