Huawei представила технологию UCM для ускорения ИИ без дорогой памяти

/ ТехнологииНовости / Технологии

Huawei официально запустила новую технологию искусственного интеллекта под названием Unified Cache Manager (UCM), которая призвана снизить зависимость от высокопроизводительной памяти HBM.

Как и ожидалось, UCM предлагает решение для управления памятью, ускоряющее работу больших ИИ-моделей. Компания заявляет, что этот фреймворк повышает пропускную способность системы и снижает задержки за счёт более эффективного распределения данных KV Cache между разными уровнями памяти.

Как UCM решает проблему «бутылочного горлышка» в ИИ

Технология UCM основана на простой, но эффективной идее — ускорять большие ИИ-модели без необходимости использования дорогостоящей памяти. Она использует иерархическую систему управления памятью для KV Cache — ключевого компонента при работе нейросетей. Данные распределяются между HBM, стандартной DRAM и SSD в зависимости от текущих потребностей в скорости доступа.

Huawei протестировала UCM в реальных бизнес-приложениях China UnionPay, включая анализ голоса клиентов, маркетинговое планирование и офисные задачи. В результате удалось добиться снижения задержек на 90% и увеличения пропускной способности в 22 раза. Эти результаты демонстрируют, как программные оптимизации могут компенсировать аппаратные ограничения.

Почему это важно для Китая

HBM — критически важный ресурс для работы крупных ИИ-моделей, обеспечивающий высокую пропускную способность и низкие задержки. Однако его производство контролируется компаниями SK Hynix, Samsung Electronics и Micron Technology. Китай сталкивается с ограничениями на экспорт новейших версий HBM (таких как HBM3 и HBM4) из-за санкций США и их союзников.

UCM от Huawei предлагает решение этой проблемы, позволяя более гибко использовать доступные типы памяти. Технология поддерживает масштабные вычисления на стандартных компонентах, что особенно важно для китайских компаний в условиях действующих технологических санкций.

Планы по открытому исходному коду

Huawei планирует открыть исходный код UCM в сентябре 2025 года. Первый релиз появится на платформе MindSpore, а затем технология будет интегрирована в популярные движки для ИИ-вычислений. Компания также поделится разработкой с партнёрами экосистемы, включая производителей систем хранения данных.

Это соответствует общей стратегии Huawei в области ИИ-аппаратного обеспечения. Ранее компания уже анонсировала планы по открытию кода своей архитектуры CANN — альтернативы технологии CUDA от Nvidia, предназначенной для разработчиков, работающих с чипами Ascend.

Ответ Китая на санкции

UCM отражает общий тренд в китайском ИИ-секторе, где программные решения компенсируют ограниченный доступ к передовому «железу». Стартапы вроде DeepSeek уже добились прогресса, оптимизируя использование памяти и развёртывание моделей. UCM продолжает эту тенденцию на инфраструктурном уровне.

Чжоу Юэфэн, вице-президент Huawei по продуктовой линейке систем хранения, подтвердил, что архитектура UCM может адаптироваться к доступным ресурсам памяти без потери производительности. Это особенно важно для дата-центров, где нагрузка на память постоянно меняется.

Разработка Huawei появляется на фоне продолжающегося технологического противостояния Китая и США. Американские власти ужесточили экспортные ограничения на передовые ИИ-чипы и высокопроизводительную память. В ответ Китай инвестирует в развитие собственной полупроводниковой отрасли, но местные производители пока отстают от мировых лидеров.

Huawei остаётся ключевым игроком в этом процессе. Компания предлагает свои решения вроде системы CloudMatrix 384 и процессоров Ascend в качестве альтернативы продукции Nvidia. По данным источников, китайские регуляторы призывают местные компании сокращать зависимость от Nvidia и AMD в чувствительных и государственных проектах.

UCM — часть этой стратегии. Повышая эффективность использования памяти через программное обеспечение, Huawei создаёт более независимую ИИ-инфраструктуру, минимизирующую зависимость от санкционного оборудования. В условиях, когда гонка ИИ всё больше зависит от пропускной способности памяти, такие технологии могут определить, как Китай будет развёртывать крупномасштабные ИИ-модели в ближайшие годы.

Напомним, что Nvidia и AMD, согласно сообщениям, согласились перечислять 15% выручки от продаж чипов в Китае американскому правительству.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии