Новый процессор APU с архитектурой «вычисления в памяти» превзошел GPU по энергоэффективности в ИИ
Компания GSI Technology, разработчик ассоциативного процессора (APU), представившая новый подход к искусственному интеллекту и высокопроизводительным вычислениям с технологией «вычислений в памяти», сообщила о публикации исследования, проведенного учеными из Корнеллского университета. Результаты подтвердили, что архитектуры APU CIM (Compute-In-Memory) от GSI Technology способны обеспечить производительность на уровне GPU для масштабных задач ИИ при значительном снижении энергопотребления благодаря высокой плотности и пропускной способности памяти, присущим архитектуре CIM.
Ключевые выводы исследования:
- Производительность на уровне GPU — процессор Gemini-I APU показал сопоставимую пропускную способность с GPU NVIDIA A6000 при работе с RAG-задачами.
- Значительное преимущество в энергопотреблении — APU демонстрирует более чем на 98% меньшее энергопотребление по сравнению с GPU на различных крупных наборах данных, что подчеркивает его эффективность и экологичность.
- Быстрее и эффективнее CPU — уникальная конструкция APU позволяет ему выполнять задачи поиска в несколько раз быстрее стандартных CPU, сокращая общее время обработки до 80%.
«Независимая проверка Корнеллского университета подтверждает то, во что мы давно верили — вычисления в памяти имеют потенциал изменить рынок AI-инференса стоимостью 100 миллиардов долларов (примерно 8 трлн руб.), — заявил Ли-Лин Шу, председатель совета директоров и главный исполнительный директор GSI Technology. — APU обеспечивает производительность уровня GPU при доле энергозатрат благодаря высокоэффективной архитектуре, ориентированной на память».
Опубликованная в ACM и представленная на конференции Micro '25, статья исследовательской группы Корнелла под названием «Характеристика и оптимизация реалистичных рабочих нагрузок на коммерческом устройстве вычислений в SRAM» представляет собой одну из первых комплексных оценок коммерческого устройства вычислений в памяти в условиях реалистичных рабочих нагрузок. Команда под руководством Корнелла провела сравнительный анализ GSI Gemini-I APU с существующими CPU и GPU, сосредоточившись на задачах RAG (retrieval-augmented generation) с наборами данных от 10 ГБ до 200 ГБ.
Результаты исследования указывают на значительные перспективы для GSI Technology, поскольку клиенты все чаще требуют повышения производительности на ватт в различных отраслях, включая Edge AI для робототехники, дронов и IoT-устройств с ограниченным энергопотреблением, а также оборонные и аэрокосмические приложения, где APU может обеспечить высокую производительность в условиях строгих ограничений по энергии и охлаждению.
«Эта выдающаяся работа Корнелла подчеркивает преимущества CIM на примере кремния Gemini-I. Наша недавно выпущенная кремниевая платформа второго поколения, Gemini-II, может обеспечить примерно в 10 раз более высокую пропускную способность и еще меньшую задержку для ресурсоемких рабочих нагрузок ИИ, одновременно повышая энергоэффективность. В перспективе Plato представляет следующий шаг вперед, предлагая еще большую вычислительную мощность при меньшем энергопотреблении для встраиваемых edge-приложений. Уникальное сочетание скорости, эффективности и программируемости APU позволяет нам открывать возможности для роста в сферах edge AI, центров обработки данных, обороны и других рынках, где энергоэффективность является критическим стратегическим преимуществом», — продолжил г-н Шу.
Исследование Корнелла также представило новую аналитическую структуру для устройств вычислений в памяти общего назначения, предоставив принципы оптимизации, которые укрепляют позиции APU как масштабируемой платформы для разработчиков и системных интеграторов. Копия публикации доступна на сайте GSI по адресу gsitechnology.com/characterizing-and-optimizing-realistic-workloads-on-a-commercial-compute-in-sram-device/.
ИИ: Технология «вычислений в памяти» действительно выглядит перспективным направлением, особенно в контексте растущих требований к энергоэффективности ИИ-систем. Если заявления подтвердятся на практике, это может изменить расстановку сил на рынке ускорителей ИИ, где сегодня доминируют GPU.
0 комментариев