NVIDIA на Hot Chips 2025 представила Blackwell как платформу для нейронного рендеринга
Выступление NVIDIA на конференции Hot Chips 2025 было посвящено не столько новому железу, сколько изменению акцентов. Архитектура Blackwell позиционируется как платформа, которая делает машинное обучение естественной частью рендеринга, а не дополнением к нему. Компания показала, как эта архитектура простирается от мощных датацентровых карт до мобильных GPU для ноутбуков, и объяснила, почему такой диапазон важен.
Вместо использования грубой силы (brute-force) фокус смещается на нейронные подходы, такие как шумоподавление и сгенерированные кадры с помощью ИИ, которые могут воспроизводить или улучшать пиксели с гораздо меньшими затратами. Для поддержки этого перехода NVIDIA переходит к вычислениям с точностью FP4, чтобы уменьшить требования к памяти и вычислительным ресурсам, а также инвестировала в улучшения планировщика, такие как переупорядочивание выполнения шейдеров и оптимизация целочисленных вычислений, чтобы потоковые мультипроцессоры оставались загруженными. В докладе также был показан внутричиповый процессор управления ИИ, который координирует данные и приоритеты, чтобы графические шейдеры и нейронные ядра не блокировали друг друга.
Практическая реализация этих концепций была не менее важна, чем сами модели. Поддержка GDDR7 в Blackwell обеспечивает более полезную пропускную способность при более низких напряжениях, что помогает как традиционным проходам рендеринга, так и большим тензорным задачам. NVIDIA описала техники для сокращения времени до первого токена в смешанных рабочих нагрузках, чтобы интерактивные агенты и графика могли удовлетворять различным требованиям к задержкам. Компания продвигает идею «гонки к простою», где система использует обученную интерполяцию или выборочный вывод вместо полного рендеринга для экономии энергии.
Нейронный рендеринг — это то, куда движется мир графики, и NVIDIA хочет ускорить каждый этап конвейера
Наконец, функции, заимствованные из мира датацентров, такие как Universal MIG, позволяют разделить один GPU на множество меньших виртуальных GPU, улучшая утилизацию для легких клиентов и обеспечивая значительный выигрыш по сравнению с простым временного разделения. Основной посыл был ясен: Blackwell — это не просто добавление терафлопс. Это переосмысление планирования и blending машинного обучения с графикой, чтобы сделать реального времени, эффективных возможностей практичными.
Источник: ServeTheHome
0 комментариев