Китайская модель GLM-5 заняла 4-е место в мире по программированию, а GPU Moore Threads обеспечили мгновенную поддержку
После выпуска компанией Zhipu AI нового поколения большой языковой модели GLM-5, китайская компания Moore Threads на основе фреймворка SGLang на своём флагманском универсальном GPU MTT S5000 выполнила полную адаптацию и проверку модели в день её релиза (Day-0).
Благодаря широкому охвату операторов и мощной экосистеме собственной архитектуры MUSA, Moore Threads успешно реализовала полный конвейер вывода модели GLM-5, в полной мере задействовав нативную поддержку формата FP8 на MTT S5000. Это позволяет обеспечить точность модели, значительно снизить потребление видеопамяти и добиться высокопроизводительного вывода GLM-5.
Для сценариев работы с длинными последовательностями в GLM-5, MTT S5000, обладая значительными вычислительными ресурсами и высокой плотностью вычислений, а также архитектурной поддержкой разреженного механизма внимания (sparse Attention), сохраняет высокую пропускную способность и низкую задержку даже при обработке большого контекста.
Ключом к мгновенной адаптации стала гибкость программного стека MUSA. Покрытие модульных тестов для нативных операторов TileLang на архитектуре MUSA превышает 80%, что позволяет повторно использовать большинство универсальных операторов, значительно снижая затраты на портирование и быстро внедряя новые архитектурные решения и функции моделей.
GLM-5 позиционируется как одна из лучших на сегодня моделей для программирования (Coding), её общая производительность на 20% выше, чем у предыдущего поколения. Основной прорыв заключается в способностях к «агентной инженерии» (Agentic Engineering). Модель не только обладает глубокими знаниями в коде, но и способна обрабатывать сложные системные инженерные задачи и длительные агентские миссии, реализуя сквозную разработку от требований до приложения.
В авторитетном глобальном рейтинге Artificial Analysis модель GLM-5 занимает 4-е место в мире и 1-е место среди открытых (open-source) моделей.
По способностям к программированию GLM-5 соответствует уровню Claude Opus 4.5, демонстрируя наилучшие результаты среди открытых моделей в общепризнанных бенчмарках. В тестах SWE-bench-Verified и Terminal Bench 2.0 она набрала 77.8 и 56.2 балла соответственно (рекорд для open-source), превзойдя по производительности Gemini 3 Pro.
Во внутреннем наборе оценок Claude Code, GLM-5 значительно превосходит предыдущее поколение GLM-4.7 (в среднем на более чем 20%) в задачах фронтенд-, бэкенд-разработки и длительных миссиях. Модель способна с минимальным вмешательством человека самостоятельно выполнять длительное агентское планирование и исполнение, рефакторинг бэкенда и глубокую отладку, а опыт её использования приближается к Opus 4.5.
ИИ: Стремительная адаптация нового ИИ-железа под свежие модели — ключевой фактор в гонке технологий. Успех Moore Threads в реализации «адаптации в день релиза» для GLM-5 демонстрирует растущую зрелость китайского стека для ИИ и создаёт интересную альтернативу на рынке, где доминируют NVIDIA и AMD.










0 комментариев