Производительность китайского процессора LoongArch значительно выросла благодаря оптимизации GNU C Library

Китайский производитель процессоров Loongson, представляющий полностью отечественную разработку, продолжает получать оптимизации для своей архитектуры LoongArch. Последнее обновление библиотеки GNU C (glibc) принесло значительный прирост производительности.

В основной репозиторий Git был добавлен патч, который по умолчанию включает выравнивание сегментов загрузки по границам прозрачных огромных страниц (Transparent Huge Pages, THP) для архитектуры LoongArch64.

Данная оптимизация по умолчанию включает выравнивание сегментов загрузки по границам прозрачных огромных страниц для LoongArch64.

Это изменение позволяет выравнивать сегменты загрузки исполняемых файлов ELF, что снижает нагрузку на буфер ассоциативной трансляции (TLB) и повышает эффективность выборки инструкций. В результате при запуске крупных бинарных программ наблюдается стабильный рост производительности.

На процессоре Loongson 3A6000 тесты показали впечатляющие результаты при компиляции инструмента Cargo, написанного на Rust: пропуски в TLB для инструкций сократились на 72%, количество использованных циклов ЦПУ уменьшилось на 4.7%, а реальное время выполнения (wall time) сократилось примерно на 4.2%. При компиляции ядра Linux с помощью LLVM реальное время выполнения сократилось примерно на 12%.

Ранее сообщалось, что линейка Loongson 6000 включает 4-8-ядерные настольные процессоры 3A/B и 16-64-ядерные серверные чипы серии 3C6000. В 2025 году они нашли применение в специализированных и вычислительных серверах, а компания рассчитывает на их серийные продажи в текущем году.

Для PC-энтузиастов представляет интерес анонсированный в прошлом году 8-ядерный настольный процессор Loongson 3B6600. При сохранении техпроцесса, но с оптимизированной микроархитектурой LA864 (против LA664 у 3A6000), его производительность на той же частоте выросла примерно на 30%.

Базовая частота, как ожидается, останется на уровне 2.5 ГГц, но будет реализована технология автоматического разгона ядра (Turbo), которая может добавить ещё около 20%, стремясь достичь отметки в 3.0 ГГц.

По данным компании, одноядерная и многоядерная производительность Loongson 3B6600 могут достичь уровня средне- и высокопроизводительных процессоров Intel 12/13-го поколений Core (i5, i7), превосходя более 50% настольных ЦПУ, представленных на рынке на момент анонса.

ИИ: Оптимизации на уровне системных библиотек — это всегда хорошая новость для экосистемы, особенно для такой молодой архитектуры, как LoongArch. Снижение TLB-промахов на 72% — это серьёзный инженерный успех, который напрямую влияет на отзывчивость системы при работе с большими приложениями. Успехи Loongson в производительности на уровне Intel Core i5/i7 12-го поколения выглядят многообещающе, хотя реальные пользовательские тесты в играх и профессиональных задачах будут окончательным вердиктом. Конкуренция на рынке процессоров только набирает обороты.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ в комментариях

Вы можете задать вопрос нашему ИИ-помощнику прямо в комментариях к этой статье. Он постарается быстро ответить или уточнить информацию.

⚠️ ИИ может ошибаться — проверяйте важную информацию.


0 комментариев

Оставить комментарий


Все комментарии - Технологии