Huawei и другие гиганты разрабатывают собственные ASIC-чипы в ответ на ограничения США
Американские экспортные ограничения подталкивают китайские компании к поиску новых решений. Huawei и другие технологические гиганты активно разрабатывают собственные ASIC-чипы, которые призваны заменить графические процессоры Nvidia.
ASIC (Application-Specific Integrated Circuit) — это специализированная интегральная схема, которая с самого начала проектируется для решения одной конкретной задачи. В отличие от универсальных GPU, ASIC лишены избыточных вычислительных модулей, что и определяет их ключевое технологическое отличие.
В последние годы ужесточение экспортного контроля США в отношении передовых полупроводников постоянно влияет на темпы развития китайской индустрии ИИ-чипов. Ранее инфраструктура ИИ-вычислений в Китае была сильно завязана на GPU от Nvidia. После введения ограничений на поставки местные производители чипов перестали просто копировать продукты Nvidia и перешли к созданию полностью независимых экосистем.
В отрасли постепенно формируются два технологических пути: универсальные GPU и специализированные ASIC-чипы. Такие компании, как Huawei, Cambricon, Alibaba и Moore Threads, выбрали разные направления. Развитие этих двух путей напрямую определяет, насколько быстро будет строиться вычислительная база для ведущих китайских больших языковых моделей, таких как DeepSeek и Alibaba.
Путь универсальных GPU: универсальная альтернатива Nvidia
Чтобы понять разницу между двумя подходами, нужно разобраться в базовом предназначении GPU. Изначально GPU создавались для обработки графики в играх. В 1990-х годах Nvidia прославилась благодаря GeForce 256, который считается первым в мире GPU.
Спустя годы, с наступлением эры ИИ, ценность GPU возросла. Их аппаратная особенность — параллельные вычисления на множестве ядер — идеально подходит для массовых параллельных вычислений, необходимых нейросетям.
При этом программируемость остается ключевым преимуществом GPU, которое трудно заменить. При фиксированной аппаратной архитектуре разработчики могут многократно переписывать соответствующее программное обеспечение, гибко адаптируясь к постоянно меняющимся архитектурам больших моделей. Именно эта гибкость позволила GPU Nvidia долгое время монопольно доминировать на мировом рынке ИИ-вычислений.
На внутреннем рынке Китая «четверку драконов» GPU-чипов составляют Moore Threads, Biren Technology, Enflame Technology и Tianshu Zhixin. Среди них особенно выделяется Moore Threads, основанная в 2020 году. Ее основатель, Чжан Цзяньчжун, много лет проработал топ-менеджером в китайском подразделении Nvidia и хорошо понимает логику построения продуктов и экосистемы Nvidia. Сейчас компания делает ставку на серию универсальных чипов MTT S5000 и является наиболее представительным китайским стартапом, идущим по пути универсальных решений, аналогичных Nvidia.
Однако, чтобы догнать зрелые зарубежные продукты, универсальным GPU требуется не только «железо», но и долгий цикл для совершенствования соответствующей программной экосистемы, что замедляет общий прогресс коммерциализации.
ASIC-чипы: направление прорыва, в которое массово инвестируют Huawei и другие крупные китайские компании
GPU — это «универсал», а главная особенность ASIC — «специализация». Логика проектирования ASIC полностью противоположна логике универсальных GPU. Если GPU можно представить как многофункционального мастера, то ASIC — это оборудование, созданное специально для одной единственной операции.
Схемы чипа полностью спроектированы под фиксированные вычислительные задачи. В них нет лишних транзисторов, энергопотребления и места для ненужных функций. Благодаря отсутствию избыточных аппаратных затрат, ASIC в специализированных сценариях ИИ-вычислений демонстрируют значительно более высокую скорость и энергоэффективность по сравнению с универсальными чипами. Это и есть основная причина, по которой ведущие китайские технологические компании сейчас активно вкладываются в направление ASIC.
В зависимости от типа математических операций, для которых оптимизирован чип, в Китае сформировались три зрелые разновидности архитектуры ASIC: NPU, TPU и PPU. Каждая из них имеет четкие отличия в логике проектирования и сценариях применения.
Первый тип — NPU (Neural Processing Units, нейронные процессоры). Их аппаратная архитектура создана по образу и подобию работы нейронных сетей человеческого мозга. Схемы оптимизированы для таких задач, как вычисление весов нейросети и извлечение признаков. Это самый распространенный тип специализированных ASIC для обучения и инференса больших моделей. Вся серия Ascend от Huawei и линейка Siyuan от Cambricon относятся к NPU.
Второй тип — TPU (Tensor Processing Units, тензорные процессоры). Разработаны и впервые коммерциализированы Google. Их архитектура оптимизирована для пакетных параллельных вычислений над тензорными данными в ИИ-задачах. За счет удаления избыточных модулей для общих вычислений их энергоэффективность превосходит традиционные GPU. Сегодня многие технологические компании по всему миру разрабатывают собственные TPU. В Китае компания Zhonghao Xinying уже наладила массовое производство собственных TPU.
Третий тип — PPU (Parallel Processing Units, параллельные процессоры). Это собственная кастомизированная ASIC-архитектура Alibaba (Pingtouge). Она не копирует готовые разработки NPU или TPU, а создана специально для облачных сервисов Alibaba и задач, связанных с ИИ-агентами.
Huawei углубленно работает в направлении NPU. Ее флагманские продукты — уже широко используемый Ascend 910C и находящийся в разработке новый Ascend 950. Cambricon также делает ставку на специализированную архитектуру ASIC, постоянно обновляя линейки Siyuan 590 и 690. Благодаря эффективным вычислениям на кастомизированном «железе», обе компании успешно обходят ограничения на закупку зарубежных чипов и поддерживают облачную вычислительную инфраструктуру Китая.
Кроме того, Alibaba (Pingtouge) выбрала путь собственной разработки PPU и недавно на ежегодном саммите Alibaba Cloud официально представила процессор Zhenwu M890. По официальным данным, его общая производительность в три раза превышает производительность предыдущего поколения Zhenwu 810E, а оптимизация точно нацелена на текущие потребности в вычислениях для ИИ-агентов.
В Китае также есть стартапы, такие как Zhonghao Xinying, которые занимаются разработкой отечественных TPU. Их продукция уже вышла на стадию массового производства, что соответствует глобальному тренду, когда зарубежные технологические гиганты, такие как Google, отказываются от полной закупки универсальных GPU в пользу разработки собственных кастомизированных чипов.
По мере роста объема параметров больших моделей, технические границы между ASIC и GPU постепенно стираются. Однако с точки зрения затрат на коммерциализацию, при развертывании зрелых ИИ-приложений преимущества ASIC в стоимости развертывания и обслуживания очевидны. При расширении собственных вычислительных кластеров китайские облачные провайдеры будут все больше склоняться к закупке ASIC-чипов, и рыночная доля этого направления будет продолжать расти.
Согласно отраслевому отчету аналитика Morgan Stanley Чарли Чана от 8 мая, аналитики прогнозируют, что в 2026 году доля рынка отечественных ИИ-ускорителей в Китае существенно изменится. Ожидается, что Huawei с серией Ascend займет 62% рынка, Cambricon — 14%, а Baidu и Alibaba с собственными чипами — примерно по 5%. Ведущие производители ASIC прочно удерживают основную часть внутреннего рынка вычислений.
Результаты реальных тестов производительности подтверждают технологический прорыв отечественных ASIC. В отрасли в качестве критерия используется количество генерируемых токенов в секунду. Тесты показывают, что производительность Huawei Ascend 950 и Cambricon Siyuan 690 на 50-150% выше, чем у топового чипа H20 от Nvidia, который разрешен к продаже в Китае после введения ограничений.
Основная цель китайской ИИ-индустрии — внедрение различных продуктов для ИИ, ориентированных на массового пользователя. Более высокая эффективность генерации напрямую снижает затраты на облачные вычисления, что и является ключевой причиной быстрого захвата коммерческого рынка кастомизированными ASIC-продуктами.
«Железо» — лишь часть. Собственный программный стек — ключ к избавлению от оков CUDA
Более того, чтобы отечественным чипам действительно сломать монополию Nvidia, простого превосходства в аппаратных параметрах недостаточно. Основным барьером, удерживающим доминирующее положение Nvidia, является глубоко проработанная программная экосистема CUDA. Огромное количество разработчиков долгое время создавали программы, используя этот инструментарий, что создало сильный эффект привязки пользователей.
В этом контексте китайские производители чипов параллельно начали разрабатывать собственное соответствующее программное обеспечение. Huawei создала программный стек CANN для аппаратного обеспечения Ascend, а Moore Threads разрабатывает экосистему MUSA для своих GPU. Только совместная работа над «железом» и «софтом» позволит полностью вырваться из оков зарубежных экосистем и стабильно поддерживать работу ведущих отечественных больших моделей, таких как DeepSeek и Alibaba.
Два пути — нет лучшего или худшего. Сценарий использования определяет окончательный выбор
С точки зрения долгосрочного развития отрасли, ASIC и универсальные GPU не являются конкурентами в борьбе на выживание. Выбор пути для компании полностью определяется масштабом ее бизнеса и зрелостью разработок.
Крупные технологические компании с собственными командами разработчиков и фиксированными сценариями ИИ-задач могут получить более высокую соотношение цены и производительности вычислений, выбирая ASIC-чипы. Проекты с разнообразной повседневной нагрузкой, включающей разработку ИИ, рендеринг и смешанные вычисления, по-прежнему не смогут обойтись без гибкости универсальных GPU.
Заключение
Объективно говоря, экспортные ограничения США подтолкнули китайскую индустрию ИИ-чипов к ускорению процесса обретения независимости. В краткосрочной перспективе ASIC-продукты займут основную часть коммерческого рынка благодаря преимуществам в стоимости и производительности.
В долгосрочной перспективе универсальные GPU и ASIC будут развиваться параллельно, покрывая различные сегменты вычислительных потребностей.
По мере совершенствования отечественной программно-аппаратной экосистемы китайская цепочка ИИ-индустрии постепенно избавится от зависимости от зарубежных чипов. Промышленный цикл для отечественных вычислительных мощностей только начинается.








0 комментариев