Nvidia начала поставки процессора Vera для агентного ИИ: Oracle планирует развернуть сотни тысяч чипов

Nvidia объявила о начале поставок своего первого процессора Vera, разработанного специально для задач Agentic AI (агентного ИИ). Первые партии уже получили компании Anthropic, OpenAI, SpaceX AI и Oracle Cloud.

Vera создан для удовлетворения высоких требований агентного ИИ к вычислительной мощности процессора. На прошедшей конференции GTC глава Nvidia Дженсен Хуанг назвал его «следующим бизнесом на миллиарды долларов».

Руководитель по управлению продуктами Oracle Cloud Infrastructure (OCI) Каран Бата заявил: «OCI планирует развернуть сотни тысяч процессоров Nvidia Vera, начиная с 2026 года. Агентный ИИ требует поддержания стабильной производительности в больших масштабах. Архитектура Vera спроектирована для высокопроизводительного вывода данных, что обеспечивает необходимую эффективность для питания следующего поколения корпоративного ИИ».

В отличие от традиционных процессоров, нацеленных на максимальное количество ядер, Vera оптимизирован для высокопроизводительного вывода, вызова инструментов и генерации кода.

Процессор оснащен 88 собственными ядрами Olympus от Nvidia. Производительность одного ядра на 50% выше, чем у предшественника Grace, а пропускная способность памяти достигает 1,2 ТБ/с. Vera также поддерживает вычисления с точностью FP8, что позволяет выполнять задачи вывода ИИ и обучения с подкреплением напрямую, без промежуточной передачи данных через GPU, значительно повышая общую эффективность конвейеров ИИ.

Дженсен Хуанг отмечал: когда компания владеет GPU на сумму 50 миллиардов долларов, нельзя допускать их простоя из-за медленной работы процессора. Задача Vera — обеспечивать экстремальную однопоточную производительность и энергоэффективность, чтобы дорогостоящие GPU были полностью загружены, когда ИИ-агентам требуется одновременно обрабатывать задачи планирования, извлекать длинный контекст или вызывать API.

Кроме того, Vera будет не только самостоятельным продуктом, но и главным процессором для будущей суперчиповой платформы Vera Rubin. В этой конфигурации Vera будет объединен с двумя Rubin GPU через NVLink-C2C, формируя единую архитектуру памяти для более эффективного питания ИИ-фабрик.

Такой гетерогенный подход «CPU+GPU» может превратить Nvidia из производителя отдельных GPU в поставщика полноценных платформ для ИИ-вычислений.

В Nvidia заявили, что высокоскоростные ядра и межсоединения Vera позволяют выполнять задачи по планированию, управлению и перемещению данных, необходимые для подачи данных в GPU, с вдвое большей энергоэффективностью по сравнению с традиционной инфраструктурой.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ в комментариях

Вы можете задать вопрос нашему ИИ-помощнику прямо в комментариях к этой статье. Он постарается быстро ответить или уточнить информацию.

⚠️ ИИ может ошибаться — проверяйте важную информацию.


0 комментариев

Оставить комментарий


Все комментарии - Технологии