Nvidia начала поставки процессора Vera для агентного ИИ: Oracle планирует развернуть сотни тысяч чипов
Nvidia объявила о начале поставок своего первого процессора Vera, разработанного специально для задач Agentic AI (агентного ИИ). Первые партии уже получили компании Anthropic, OpenAI, SpaceX AI и Oracle Cloud.
Vera создан для удовлетворения высоких требований агентного ИИ к вычислительной мощности процессора. На прошедшей конференции GTC глава Nvidia Дженсен Хуанг назвал его «следующим бизнесом на миллиарды долларов».
Руководитель по управлению продуктами Oracle Cloud Infrastructure (OCI) Каран Бата заявил: «OCI планирует развернуть сотни тысяч процессоров Nvidia Vera, начиная с 2026 года. Агентный ИИ требует поддержания стабильной производительности в больших масштабах. Архитектура Vera спроектирована для высокопроизводительного вывода данных, что обеспечивает необходимую эффективность для питания следующего поколения корпоративного ИИ».
В отличие от традиционных процессоров, нацеленных на максимальное количество ядер, Vera оптимизирован для высокопроизводительного вывода, вызова инструментов и генерации кода.
Процессор оснащен 88 собственными ядрами Olympus от Nvidia. Производительность одного ядра на 50% выше, чем у предшественника Grace, а пропускная способность памяти достигает 1,2 ТБ/с. Vera также поддерживает вычисления с точностью FP8, что позволяет выполнять задачи вывода ИИ и обучения с подкреплением напрямую, без промежуточной передачи данных через GPU, значительно повышая общую эффективность конвейеров ИИ.
Дженсен Хуанг отмечал: когда компания владеет GPU на сумму 50 миллиардов долларов, нельзя допускать их простоя из-за медленной работы процессора. Задача Vera — обеспечивать экстремальную однопоточную производительность и энергоэффективность, чтобы дорогостоящие GPU были полностью загружены, когда ИИ-агентам требуется одновременно обрабатывать задачи планирования, извлекать длинный контекст или вызывать API.
Кроме того, Vera будет не только самостоятельным продуктом, но и главным процессором для будущей суперчиповой платформы Vera Rubin. В этой конфигурации Vera будет объединен с двумя Rubin GPU через NVLink-C2C, формируя единую архитектуру памяти для более эффективного питания ИИ-фабрик.
Такой гетерогенный подход «CPU+GPU» может превратить Nvidia из производителя отдельных GPU в поставщика полноценных платформ для ИИ-вычислений.
В Nvidia заявили, что высокоскоростные ядра и межсоединения Vera позволяют выполнять задачи по планированию, управлению и перемещению данных, необходимые для подачи данных в GPU, с вдвое большей энергоэффективностью по сравнению с традиционной инфраструктурой.







0 комментариев