Nvidia повышает TDP и производительность платформы Vera Rubin для борьбы с AMD Instinct

Недавно Nvidia объявила о начале «полномасштабного производства» своей платформы Vera Rubin для AI-дата-центров, подтвердив планы на запуск в этом году и опередив конкурентов вроде AMD. Однако, помимо возможного ускорения релиза, компания также, по сообщениям, пересматривает спецификации GPU Rubin для повышения производительности: согласно данным, тепловыделение (TDP) вырастет до 2.30 кВт на GPU, а пропускная способность памяти составит 22.2 ТБ/с.

По данным аналитиков Keybanc (через инсайдера @Jukan05), энергопотребление GPU Rubin теперь установлено на уровне 2.3 кВт. Это больше, чем изначально заявленные 1.8 кВт, но меньше, чем ожидавшиеся некоторыми наблюдателями 2.5 кВт. Цель повышения TDP с 1.8 кВт — обеспечить заметное преимущество в производительности платформ на базе Rubin в этом году по сравнению с ускорителями AMD Instinct MI455X, которые, как ожидается, будут работать на уровне около 1.7 кВт.

Информация о повышении энергопотребления Rubin поступает из неофициальных источников, но косвенно подтверждается аналитической фирмой SemiAnalysis, которая утверждает, что Nvidia увеличила скорости передачи данных в стеках памяти HBM4. Теперь каждый GPU Rubin будет обладать пропускной способностью памяти 22.2 ТБ/с вместо 13 ТБ/с. Редакция Tom's Hardware обратилась к Nvidia за комментариями.

Дополнительные ~500 Вт дают Nvidia несколько вариантов для улучшения реальной, а не только декларируемой на бумаге, производительности. Это позволит поддерживать более высокие стабильные частоты при непрерывных тренировочных и инференсных нагрузках, а также снизить троттлинг при полной загрузке AI-ускорителя. Дополнительная мощность также облегчит одновременную работу большего числа исполнительных блоков, что повысит пропускную способность в сложных рабочих нагрузках, где одновременно загружены вычислительные модули, память и межсоединения.

Помимо тензорных ядер, дополнительный энергобюджет может быть использован для работы памяти HBM4 и физических уровней (PHY) на более высоких частотах, что увеличит пропускную способность памяти. Более высокий TDP также позволит Nvidia повысить производительность всех каналов связи (включая память, внутренние межсоединения и NVLink), сохраняя при этом стабильность сигнала. Это становится всё более важным, поскольку современные AI-системы всё чаще упираются в ограничения пропускной способности памяти и производительности межсоединений.

На системном уровне дополнительные 500 Вт TDP для AI-ускорителей означают более высокую производительность на узел и на стойку. Крупные облачные провайдеры (гиперскалеры) ценят высокую производительность на уровне системы больше, чем производительность отдельного GPU, так как для выполнения той же задачи может потребоваться меньше GPU, что снижает нагрузку на сеть и повышает эффективность кластера. Это, конечно, при условии, что эти провайдеры смогут обеспечить питанием машины со значительно возросшим энергопотреблением.

Наконец, более высокий TDP также помогает на этапе производства, обеспечивая более гибкий биннинг и запас по напряжению, что улучшает выход годных чипов без необходимости отключать исполнительные блоки или снижать частоты.

Таким образом, дополнительные 500 Вт служат не только для повышения производительности GPU Rubin и конкурентоспособности масштабируемых решений на стойку VR200 NVL144, но и создают запас надёжности, гарантируя, что GPU сможет обеспечивать предсказуемую, стабильную пропускную способность в крупных дата-центрах, а не просто демонстрировать высокие пиковые цифры на бумаге. В качестве бонуса Nvidia потенциально сможет поставить на рынок больше GPU Rubin, что положительно скажется на её финансовых результатах.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии