Видеокарты NVIDIA GB300 показали огромный прирост эффективности в тестах с DeepSeek R1
Новые видеокарты NVIDIA GB300 на архитектуре Blackwell начинают демонстрировать свои возможности, и первые результаты указывают на огромный скачок эффективности по сравнению с предыдущим поколением компании. Недавний тест от CoreWeave показывает, насколько новые чипы повышают производительность ИИ при выполнении одних из самых ресурсоемких задач сегодняшнего дня.
В тестах с использованием модели DeepSeek R1 всего четыре видеокарты GB300 продемонстрировали производительность, эквивалентную 16 H100. Это дает примерно шестикратную пропускную способность на одну карту благодаря как аппаратным улучшениям, так и более эффективной архитектуре.
Платформа GB300 NVL72 может масштабироваться до 37 ТБ памяти (максимум 40 ТБ) с пропускной способностью памяти 130 ТБ/с, что позволяет ей работать с чрезвычайно большими моделями ИИ без узких мест, характерных для старого оборудования. Она также использует 4-ходовой тензорный параллелизм (TP4), в то время как H100 требовал 16-ходового разделения (TP16) для достижения аналогичного масштаба. Меньшее количество разделений означает меньшие накладные расходы на связь, а межсоединения NVLink и NVSwitch пятого поколения от NVIDIA помогают сохранять низкую задержку.
Для бизнеса, использующего крупные сервисы ИИ, это означает более быструю генерацию токенов, более низкую стоимость одного вывода и более простой путь к масштабированию. CoreWeave отметила, что улучшения в эффективности напрямую переводятся в практические преимущества для таких рабочих нагрузок, как моделей логического вывода, где производительность на ватт и задержка имеют критическое значение.
Конечно, оборудование не будет дешевым. Ожидается, что системы на базе GB300 NVL72 будут стоить от примерно 300 000 долларов (~24 млн руб.), что однозначно относит их к корпоративному сегменту. Но для компаний, уже активно инвестирующих в инфраструктуру ИИ, скачок производительности может оправдать стоимость.
Если эти ранние цифры подтвердятся по мере расширения развертываний, GB300 может ознаменовать один из самых больших поколенческих скачков, которые когда-либо демонстрировала NVIDIA, и установить новый базовый уровень для высокопроизводительных вычислений ИИ.
0 комментариев