Huawei представила технологию UCM для ускорения ИИ без дорогой памяти
Huawei официально запустила новую технологию искусственного интеллекта под названием Unified Cache Manager (UCM), которая призвана снизить зависимость от высокопроизводительной памяти HBM.
Как и ожидалось, UCM предлагает решение для управления памятью, ускоряющее работу больших ИИ-моделей. Компания заявляет, что этот фреймворк повышает пропускную способность системы и снижает задержки за счёт более эффективного распределения данных KV Cache между разными уровнями памяти.
Как UCM решает проблему «бутылочного горлышка» в ИИ
Технология UCM основана на простой, но эффективной идее — ускорять большие ИИ-модели без необходимости использования дорогостоящей памяти. Она использует иерархическую систему управления памятью для KV Cache — ключевого компонента при работе нейросетей. Данные распределяются между HBM, стандартной DRAM и SSD в зависимости от текущих потребностей в скорости доступа.
Huawei протестировала UCM в реальных бизнес-приложениях China UnionPay, включая анализ голоса клиентов, маркетинговое планирование и офисные задачи. В результате удалось добиться снижения задержек на 90% и увеличения пропускной способности в 22 раза. Эти результаты демонстрируют, как программные оптимизации могут компенсировать аппаратные ограничения.
Почему это важно для Китая
HBM — критически важный ресурс для работы крупных ИИ-моделей, обеспечивающий высокую пропускную способность и низкие задержки. Однако его производство контролируется компаниями SK Hynix, Samsung Electronics и Micron Technology. Китай сталкивается с ограничениями на экспорт новейших версий HBM (таких как HBM3 и HBM4) из-за санкций США и их союзников.
UCM от Huawei предлагает решение этой проблемы, позволяя более гибко использовать доступные типы памяти. Технология поддерживает масштабные вычисления на стандартных компонентах, что особенно важно для китайских компаний в условиях действующих технологических санкций.
Планы по открытому исходному коду
Huawei планирует открыть исходный код UCM в сентябре 2025 года. Первый релиз появится на платформе MindSpore, а затем технология будет интегрирована в популярные движки для ИИ-вычислений. Компания также поделится разработкой с партнёрами экосистемы, включая производителей систем хранения данных.
Это соответствует общей стратегии Huawei в области ИИ-аппаратного обеспечения. Ранее компания уже анонсировала планы по открытию кода своей архитектуры CANN — альтернативы технологии CUDA от Nvidia, предназначенной для разработчиков, работающих с чипами Ascend.
Ответ Китая на санкции
UCM отражает общий тренд в китайском ИИ-секторе, где программные решения компенсируют ограниченный доступ к передовому «железу». Стартапы вроде DeepSeek уже добились прогресса, оптимизируя использование памяти и развёртывание моделей. UCM продолжает эту тенденцию на инфраструктурном уровне.
Чжоу Юэфэн, вице-президент Huawei по продуктовой линейке систем хранения, подтвердил, что архитектура UCM может адаптироваться к доступным ресурсам памяти без потери производительности. Это особенно важно для дата-центров, где нагрузка на память постоянно меняется.
Разработка Huawei появляется на фоне продолжающегося технологического противостояния Китая и США. Американские власти ужесточили экспортные ограничения на передовые ИИ-чипы и высокопроизводительную память. В ответ Китай инвестирует в развитие собственной полупроводниковой отрасли, но местные производители пока отстают от мировых лидеров.
Huawei остаётся ключевым игроком в этом процессе. Компания предлагает свои решения вроде системы CloudMatrix 384 и процессоров Ascend в качестве альтернативы продукции Nvidia. По данным источников, китайские регуляторы призывают местные компании сокращать зависимость от Nvidia и AMD в чувствительных и государственных проектах.
UCM — часть этой стратегии. Повышая эффективность использования памяти через программное обеспечение, Huawei создаёт более независимую ИИ-инфраструктуру, минимизирующую зависимость от санкционного оборудования. В условиях, когда гонка ИИ всё больше зависит от пропускной способности памяти, такие технологии могут определить, как Китай будет развёртывать крупномасштабные ИИ-модели в ближайшие годы.
Напомним, что Nvidia и AMD, согласно сообщениям, согласились перечислять 15% выручки от продаж чипов в Китае американскому правительству.
0 комментариев