Nvidia убрала ускорители Rubin CPX из своей дорожной карты

Во время выступления генерального директора Nvidia Дженсена Хуанга на конференции GTC 2026 в понедельник, 16 марта, внимание наблюдателей привлекло отсутствие упоминаний об ускорителе контекстной фазы Rubin CPX. Этот продукт компания продвигала в прошлом году как важную часть платформы Vera Rubin. Rubin CPX также не было на слайдах презентации, зато на них фигурировали предстоящие процессоры Groq 3 LPU и стойки LPX. Это может указывать на то, что эти процессоры заменяют CPX в планах Nvidia.

Графический процессор Nvidia Rubin CPX должен был стать частью платформ компании Vera Rubin и Vera Rubin Ultra. Эти GPU были разработаны для ускорения начальной, требующей больших вычислений, контекстной фазы запроса, которая обрабатывает входные данные для генерации первого выходного токена. Главным преимуществом ускорителя контекстной фазы была его зависимость от памяти GDDR7, которая не предлагает экстремальной пропускной способности, как HBM3E или HBM4, но потребляет значительно меньше энергии. Это, как утверждалось, должно было существенно повысить конкурентоспособность платформы Rubin Nvidia для задач логического вывода (инференса).

Однако на слайдах, представленных Nvidia на GTC, продуктов Rubin CPX нет, зато есть Groq 3 LPU. Это может означать, что компания теперь больше сосредоточена на последнем.

Изображение: Nvidia

Низколатентные ускорители инференса Nvidia Groq 3 — которые Nvidia называет LPU — предназначены для обеспечения значительной производительности логического вывода с чрезвычайно низкой задержкой. Они в основном полагаются на внутреннюю SRAM-память, которая по определению быстрее, имеет меньшую задержку и потребляет меньше энергии, чем любой тип DRAM. Например, процессор Nvidia LP30 оснащен 512 МБ SRAM и предлагает производительность 1,23 PFLOPS (FP8) или 9,6 PFLOPS на вычислительном лотке Groq 3 LPX, или 315 PFLOPS (FP8) на стойку. Для сравнения, ускоритель Rubin CPX должен был обеспечивать до 30 PFLOPS (NVFP4) вычислительной мощности, но с существенно более высокой задержкой.

Пока остается неясным, будет ли Nvidia фактически предлагать свои ускорители Rubin CPX или переориентирует усилия на низколатентные ускорители инференса Groq 3 LPU. Учитывая недавнюю покупку Nvidia неэксклюзивной лицензии на технологии и таланты стартапа Groq за 20 миллиардов долларов (~1.6 трлн рублей), такой шаг был бы логичен. Отсутствие Rubin CPX на слайдах дорожной карты и публичное предпочтение процессорам LPU — довольно четкий индикатор приоритетов компании. Тем не менее, возможно, что некоторые клиенты Nvidia все же развернут ускорители CPX, так как они уже инвестировали в их внедрение, адаптировав свое программное обеспечение под эти процессоры. В конце концов, продукты вне официальной дорожной карты — довольно распространенное явление в отрасли.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Все комментарии - Технологии