Видеокарты NVIDIA GB300 показали огромный прирост эффективности в тестах с DeepSeek R1

Новые видеокарты NVIDIA GB300 на архитектуре Blackwell начинают демонстрировать свои возможности, и первые результаты указывают на огромный скачок эффективности по сравнению с предыдущим поколением компании. Недавний тест от CoreWeave показывает, насколько новые чипы повышают производительность ИИ при выполнении одних из самых ресурсоемких задач сегодняшнего дня.

В тестах с использованием модели DeepSeek R1 всего четыре видеокарты GB300 продемонстрировали производительность, эквивалентную 16 H100. Это дает примерно шестикратную пропускную способность на одну карту благодаря как аппаратным улучшениям, так и более эффективной архитектуре.

Платформа GB300 NVL72 может масштабироваться до 37 ТБ памяти (максимум 40 ТБ) с пропускной способностью памяти 130 ТБ/с, что позволяет ей работать с чрезвычайно большими моделями ИИ без узких мест, характерных для старого оборудования. Она также использует 4-ходовой тензорный параллелизм (TP4), в то время как H100 требовал 16-ходового разделения (TP16) для достижения аналогичного масштаба. Меньшее количество разделений означает меньшие накладные расходы на связь, а межсоединения NVLink и NVSwitch пятого поколения от NVIDIA помогают сохранять низкую задержку.

Для бизнеса, использующего крупные сервисы ИИ, это означает более быструю генерацию токенов, более низкую стоимость одного вывода и более простой путь к масштабированию. CoreWeave отметила, что улучшения в эффективности напрямую переводятся в практические преимущества для таких рабочих нагрузок, как моделей логического вывода, где производительность на ватт и задержка имеют критическое значение.

Конечно, оборудование не будет дешевым. Ожидается, что системы на базе GB300 NVL72 будут стоить от примерно 300 000 долларов (~24 млн руб.), что однозначно относит их к корпоративному сегменту. Но для компаний, уже активно инвестирующих в инфраструктуру ИИ, скачок производительности может оправдать стоимость.

Если эти ранние цифры подтвердятся по мере расширения развертываний, GB300 может ознаменовать один из самых больших поколенческих скачков, которые когда-либо демонстрировала NVIDIA, и установить новый базовый уровень для высокопроизводительных вычислений ИИ.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Все комментарии - Технологии