Дженсен Хуан: NVIDIA не против CPU, но их одноядерная производительность слишком слаба
На прошедшей конференции GTC NVIDIA представила ряд продуктов для ИИ, включая GPU Rubin и новые LPU, но особого внимания заслуживает анонс процессора Vera CPU, который компания впервые выводит на рынок для внешних покупателей.
Глава NVIDIA Дженсен Хуан заявил, что это первый в мире процессор, созданный специально для ИИ-агентов и обучения с подкреплением. По его словам, его эффективность вдвое выше, а скорость на 50% больше, чем у традиционных CPU.
Слухи о том, что NVIDIA займётся разработкой процессоров, ходили в индустрии более десяти лет. Однако ключевой вопрос — чем Vera CPU будет отличаться от продуктов таких гигантов, как AMD и Intel, и как NVIDIA убедит десятки клиентов его приобрести.
В интервью после мероприятия Дженсен Хуан рассказал о философии компании в этом направлении. Он чётко дал понять, что NVIDIA не выступает против CPU как таковых и не ставит целью их уничтожение или нарушение закона Амдала.
Напротив, NVIDIA всегда покупала самые передовые и дорогие процессоры, потому что, если производительность CPU не будет высочайшей, это может стать узким местом и свести на нет эффективность ускорителей (в первую очередь GPU) стоимостью в миллионы долларов.
В итоге компании пришлось взяться за разработку собственного CPU. В NVIDIA считают, что традиционный путь наращивания транзисторов себя исчерпал. Их цель — создать процессор для новой эпохи ИИ, особенно для эры интеллектуальных агентов.
Хуан объяснил разницу в подходах. Традиционные процессоры для гипермасштабируемых облачных сервисов делают ставку на максимальное количество ядер, а мощность одного ядра отходит на второй план. В NVIDIA же считают, что у существующих CPU одноядерная производительность слишком слаба. Поэтому их процессор будет сфокусирован на выдающейся однопоточной производительности и непревзойдённой скорости ввода-вывода (IO).
Если взглянуть на заявленные характеристики Vera CPU — 88 ядер с поддержкой многопоточности, пропускная способность памяти LPDDR5X — 1.2 ТБ/с, а пропускная способность межсоединения NVLink-C2C — 1.8 ТБ/с (что в 7 раз быстрее PCIe 6.0), — становится понятно, что Хуан имел в виду под «непревзойдённым IO».
Однако насколько именно мощным окажется одноядерное быстродействие Vera CPU, достоверных данных пока нет. Скорее всего, это превосходство будет заметно на фоне серверных CPU для облачных вычислений. Ожидать, что ARM-архитектура в ближайшее время обойдёт по одноядерной производительности топовые x86-решения, пока преждевременно.








0 комментариев