Дженсен Хуанг: NVIDIA будет использовать ИИ для снижения потребления памяти в ПК и видеокартах

Рост цен на оперативную память принес баснословные прибыли Samsung, SK Hynix и Micron, которые за год зарабатывают столько, сколько раньше получали за десять лет. Однако для производителей ПК и видеокарт эта ситуация обернулась серьезными проблемами — продажи резко упали.

NVIDIA, будучи одним из крупнейших потребителей памяти, сейчас явно отдает приоритет поставкам для ИИ-ускорителей. Игровой сегмент, включая GeForce, даже перестали выделять в отдельную категорию в отчетах, отнеся его к периферийным вычислениям.

На выставке ComputX на прошлой неделе компания представила RTX Spark — новую категорию ПК, позиционируемую как локальная платформа для ИИ-вычислений. Такие системы поддерживают до 128 ГБ оперативной памяти, что еще больше увеличивает спрос на чипы.

Как же NVIDIA планирует решать проблему дефицита памяти для RTX Spark и игровых видеокарт GeForce? В интервью после презентации Дженсен Хуанг ответил кратко: «Мы будем использовать ИИ для снижения потребления памяти».

Подробностей реализации он не привел, возможно, это было лишь общее заявление. Однако технически снизить объем используемой видеопамяти с помощью ИИ вполне реально. Ранее в этом году NVIDIA уже предприняла шаги в этом направлении: компания не только возобновила производство некоторых моделей RTX 30-й серии, но и анонсировала поддержку алгоритма NVFP4 на старых платформах.

По сравнению с FP16 и FP8, стандарт FP4 позволяет значительно повысить производительность и снизить требования к памяти. NVFP4 — это собственная оптимизация NVIDIA, которая нативно поддерживается только на архитектуре Blackwell. Однако на видеокартах RTX 30 и 40 серий этот алгоритм может работать программно, хотя и с меньшей эффективностью.

NVIDIA уже опубликовала данные о тестировании FP4 на своих ускорителях. Прирост производительности в различных ИИ-задачах варьируется: от 30-40% в легких сценариях до двукратного увеличения в более сложных. В тесте Qwen Image производительность выросла на 360%.

Помимо роста скорости, FP4 значительно сокращает объем используемой видеопамяти. Например, в Flux.1 потребление памяти упало с 23 ГБ до 9 ГБ, в Flux.2 — с 87 ГБ до 26 ГБ, а в Qwen Image — с 40 ГБ до 18 ГБ. В среднем это позволяет снизить нагрузку на видеопамять вдвое, а в некоторых случаях — на две трети.

Разумеется, эти тесты проводились для ИИ-приложений. Теоретически FP4 можно использовать и в рендеринге. Ранее NVIDIA уже анонсировала DLSS 5, которая применяет ИИ для генерации игровых кадров. Однако эта технология вызывает споры, и пока неясно, будет ли она внедряться и появится ли на видеокартах RTX 30-й серии.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ в комментариях

Вы можете задать вопрос нашему ИИ-помощнику прямо в комментариях к этой статье. Он постарается быстро ответить или уточнить информацию.

⚠️ ИИ может ошибаться — проверяйте важную информацию.


0 комментариев

Оставить комментарий


Все комментарии - Технологии