NVIDIA начала поставки процессоров Vera для систем ИИ
NVIDIA副总裁, «отец CUDA» Ян Бак лично доставил первые процессоры Vera CPU клиентам Anthropic, OpenAI, SpaceX и Oracle. Это знаменует выход первого собственного процессора NVIDIA для дата-центров из лаборатории на этап внедрения.
Процессор Vera является преемником Grace и разработан специально для рабочих нагрузок агентного ИИ. В отличие от Grace, который в основном служил вспомогательным хост-процессором для GPU, Vera получил более четкую самостоятельную роль, отвечая за оркестровку, вызов инструментов, обучение с подкреплением, анализ данных, изоляцию «песочницы» агента и управление длинным контекстом.
Чип использует следующую кастомную Arm-архитектуру NVIDIA — Olympus, оснащен 88 ядрами и 176 потоками, объем системной памяти составляет 1,5 ТБ (в 3 раза больше, чем у Grace), пропускная способность памяти — 1,2 ТБ/с, а пропускная способность NVLink-C2C — 1,8 ТБ/с. Поддерживаются конфиденциальные вычисления уровня стойки.
NVIDIA заявляет, что производительность одного ядра Vera на 50% выше, чем у Grace, а производительность обработки данных, сжатия и CI/CD вдвое выше.
В плане памяти Vera является первым в мире процессором для дата-центров, использующим LPDDR5. В нем применяются модули LPDDR5X в корпусе SOCAMM.
Традиционные процессоры для дата-центров обычно полагаются на DDR5 или HBM, тогда как LPDDR5 ранее почти исключительно использовался в мобильных устройствах и ультрабуках.
Логика NVIDIA в выборе этого пути — энергоэффективность. LPDDR5 обеспечивает высокую пропускную способность при значительно меньшем энергопотреблении по сравнению с DDR5. NVIDIA утверждает, что производительность на ватт у Vera является одной из лучших в отрасли.
Однако объем памяти в 1,5 ТБ означает, что один процессор Vera будет потреблять большое количество LPDDR5X. Ожидается, что с началом массовых поставок Vera спрос на LPDDR5X DRAM значительно вырастет, что может привести к дальнейшему ужесточению цепочек поставок.
Ранее сообщалось, что CoreWeave, Meta и другие станут первыми пользователями Vera. Oracle также входит в их число. С учетом фактической поставки Anthropic, OpenAI и SpaceX, ранние клиенты Vera охватывают наиболее влиятельные компании в сфере ИИ на сегодняшний день.
Процессор Vera будет поставляться в двух форм-факторах: как отдельный сервер LPX и как хост-процессор для стойки Vera Rubin NVL72.
NVIDIA не только интегрирует Vera в платформу Vera Rubin, но и будет продавать процессоры Vera отдельно, ожидая, что это откроет новый многомиллиардный бизнес.
* Meta, Facebook и Instagram запрещены в России.












0 комментариев