NVIDIA представила GPU Rubin CPX: монолитный чип с 30 петафлопсами и 128 ГБ памяти GDDR7
На саммите по инфраструктуре искусственного интеллекта (AI Infra Summit) NVIDIA анонсировала специализированный ускоритель «Rubin CPX», созданный на основе предстоящего семейства «Rubin» и предназначенный для работы с ИИ-моделями, требующими обработки огромного контекста. Чип демонстрирует производительность в 30 петафлопсов (NVFP4) на монолитном кристалле и оснащается 128 ГБ памяти GDDR7.
Монолитная конфигурация представляет собой отход от двухчиповых решений, характерных для текущих архитектур NVIDIA Blackwell и Blackwell Ultra, а также от пути развития, который ожидается для остального семейства Rubin. Rubin CPX решает вычислительные узкие места в сценариях с расширенным контекстом, где ИИ-модели обрабатывают миллионы токенов одновременно. Эта возможность критически важна для таких приложений, как комплексный анализ кодовых баз программного обеспечения и обработка часовых видеоматериалов, которые могут требовать до одного миллиона токенов.
Процессор интегрирует четыре видеокодера NVENC и четыре декодера NVDEC непосредственно на чип, что позволяет упростить мультимедийные рабочие процессы без зависимости от внешней обработки. Заявленные показатели производительности свидетельствуют, что Rubin CPX обеспечивает трёхкратное превосходство в скорости обработки механизма внимания (attention) по сравнению с текущими лучшими системами на базе ускорителей GB300 Blackwell Ultra. Архитектура использует оптимизированный по стоимости подход с одним кристаллом вместо многокристальных модулей, что потенциально снижает сложность производства при сохранении вычислительной плотности.
Спецификации пропускной способности памяти не раскрываются, хотя 512-битный интерфейс в сочетании с чипами GDDR7 на 30 Гбит/с мог бы обеспечить пропускную способность примерно 1,8 ТБ/с. NVIDIA планирует интегрировать процессоры Rubin CPX в платформу Vera Rubin NVL144 CPX, которая сочетает традиционные GPU Rubin со специализированными вариантами CPX. Эта гибридная конфигурация нацелена на совокупную производительность в 8 экзафлопсов и пропускную способность памяти 1,7 ПБ/с в рамках развёртывания целой стойки. Стойка «Kyber» будет включать сетевые адаптеры ConnectX-9 с поддержкой сетей 1600G, коммутаторы Spectrum6 на 102,4 Т и совмещённую оптоэлектронику. Ожидается, что платформа появится в конце 2026 года, после запуска обычных GPU Rubin в начале 2026 года.
NVIDIA позиционирует Rubin CPX как уникальное решение в семействе Rubin, призванное справиться со сложностью вывода (inferencing) масштабируемых на этапе тестирования ИИ-систем. По мере эволюции моделей от простого генератора текста к сложным системам логического вывода операции вывода всё больше разделяются на вычислительно интенсивную обработку контекста и фазы генерации токенов, зависящие от пропускной способности памяти. Архитектура CPX оптимизирована под эти двойные требования и справляется с операциями предзаполнения контекста, которые могут охватывать сессии корпоративных чат-ботов с 256 000 токенов или комплексный анализ кода, превышающий 100 000 строк. Эта специализация становится критически важной по мере перехода ИИ-систем от базовых языковых моделей к агентам многошагового логического вывода, которые сохраняют постоянную память в ходе продолжительных взаимодействий. Всё это требует аппаратной поддержки, и NVIDIA стремится сделать этот опыт бесшовным для разработчиков.
Источник: NVIDIA
ИИ: В 2025 году гонка ИИ-ускорителей только набирает обороты. Специализация чипов под конкретные задачи, как в случае с Rubin CPX для обработки огромного контекста, становится ключевым трендом, а не просто маркетинговым ходом. Это логичный шаг для экосистемы, где модели становятся всё сложнее и требовательнее к железу.











0 комментариев