ARM представила новые процессорные ядра C1 и графические Mali G1 для Dimensity 9500
Компания ARM анонсировала новое поколение процессорных и графических ядер, которые будут использоваться в чипсете MediaTek Dimensity 9500, запуск которого ожидается позже в этом месяце. Компания внесла несколько изменений в этом поколении, начиная с самой системы именования.
ARM отказалась от привычных обозначений Cortex-X и Cortex-A в пользу нового семейства C1. На вершине линейки находится C1-Ultra, за которым следуют C1-Premium (версия с уменьшенным размером), C1-Pro для среднего уровня производительности и ориентированный на энергоэффективность C1-Nano. Все эти ядра основаны на архитектуре ARMv9.3 ISA.
C1-Ultra по сути является преемником Cortex-X925, и ARM заявляет, что он обеспечивает прирост IPC на 12% по сравнению с прошлогодним ядром, а при более высоких тактовых частотах на 3-нм техпроцессе этот показатель достигает 25%. Важно, что C1-Ultra обеспечивает такой прирост, одновременно сокращая энергопотребление почти на 28% при равном уровне производительности.
Между тем, C1-Pro заменяет Cortex-A725 и может достичь той же производительности, что и его предшественник, при потреблении на 26% меньше энергии, или обеспечить на 11% больше производительности при том же уровне энергопотребления.
Наконец, C1-Nano развивает идеи Cortex-A520 с акцентом на улучшение предсказания ветвлений и кэша, что дает прирост производительности на 5–8%, но улучшение энергоэффективности на 26%.
Ключевые характеристики семейства ARM C1
Набор инструкций SME2
Возможно, самой заметной особенностью CPU в этом году является SME2 (Scalable Matrix Extension 2). В отличие от предыдущих SIMD-расширений, таких как NEON или SVE, SME2 работает как общий внешний ускоритель, а не встраивается в каждое ядро. Такая модульная конструкция позволяет всем ядрам обращаться к блокам SME2 при необходимости, а в режиме простоя полностью отключать их для экономии энергии.
По словам ARM, SME2 лучше справляется с задачами ИИ, демонстрируя:
- В 4,7 раза меньшую задержку при распознавании речи
- В 2,8 раза более быструю генерацию Stable Audio
- В среднем в 3,7 раза больший прирост в ML-бенчмарках
Хотя SME2 не заменит специализированные NPU или GPU для больших моделей, он должен обеспечить более плавный вывод ИИ на устройстве для небольших моделей, особенно в сценариях, где NPU недоступен.
Графика Mali G1
На графическом фронте ARM отказывается от бренда Immortalis и представляет новую линейку GPU Mali. Первое семейство Mali G1 включает версии Ultra (10+ ядер), Premium (6–9 ядер) и Pro (1–5 ядер).
Флагманский Mali G1-Ultra демонстрирует на 20% более высокую производительность по сравнению с прошлогодним Immortalis G925, а также на 9% меньше энергии на кадр и до 2 раз более быструю трассировку лучей благодаря выделенному аппаратному обеспечению для обхода BVH. Улучшенная пропускная способность кэша и межсоединения памяти дополнительно снижает узкие места и повышает утилизацию.
Тем не менее, реальный прирост в трассировке лучей может быть ближе к 40%, поскольку немногие мобильные игры полностью используют новое аппаратное обеспечение. Тем не менее, решение ARM объединить трассировку лучей и тестирование пересечений в единую структуру должно сделать RTU более энергоэффективным, чем раньше.
(Источник)
0 комментариев