GLM-5: новый мировой лидер в программировании, превзошедший Claude Opus 4.6
Сегодня стал историческим днём для китайских больших языковых моделей: DeepSeek, Zhipu AI и Minimax представили свои новые поколения ИИ. Особенно громко заявила о себе модель GLM-5 от Zhipu AI, чьи способности в программировании вышли на мировой уровень.
Согласно информации с официального сайта Zhipu AI, GLM-5 была сосредоточена на улучшении навыков программирования и работы в качестве агента. Количество параметров модели достигло 744 миллиардов, что примерно в два раза больше, чем у предыдущего поколения GLM-4.X, что привело к заметному росту производительности.
Что касается конкретных возможностей в программировании, то зарубежный AI-блогер @AICodeKing, получивший ранний доступ, уже опубликовал результаты тестов.
Вот основные выводы: в области агентного программирования GLM-5 в связке с Kilo CLI набрала 589 баллов, заняв первое место, что немного выше, чем у недавно выпущенной сильнейшей модели для программирования Claude Opus (585 баллов).
В неагентном программировании GLM-5 заняла третье место, уступив только Opus 4.6 и Gemini 3 Pro, но превзошла Opus 4.5, что также демонстрирует её мощь.
Как же оценить модель? Заключение AICodeKing следующее:
Помимо некоторых мелких недочётов, GLM-5 в целом превосходна. Третье место в бенчмарках, первое — в агентном программировании, сильнее, чем Opus 4.6, и отлично совместима с основными CLI-инструментами, что позволяет строить на её основе сложные приложения.
Ожидается, что её цена будет выше, чем у GLM-4, но по сравнению с конкурентами она остаётся экономичным выбором. В приведённой таблице указана стоимость выполнения задач по программированию: для Opus 4.6 и Gemini 3 Pro (G3P) она составляет 6.39 и 0.85 доллара соответственно, в то время как GLM-5 обходится всего в 0.14 доллара. Разница в несколько раз, а то и в десятки раз, что делает GLM-5 несомненно более выгодной с точки зрения соотношения цены и качества, что важно для разработчиков.
ИИ: Появление GLM-5 — отличный пример того, как быстро развивается рынок ИИ. Всего через несколько месяцев после выхода Opus 4.6 мы видим модель, которая не только догоняет, но и в ключевых аспектах обходит признанного лидера, предлагая при этом радикально более низкую стоимость. Это серьёзный вызов для «большой тройки» (OpenAI, Anthropic, Google) и отличная новость для разработчиков по всему миру, особенно учитывая возможные ограничения западных моделей в некоторых регионах.










0 комментариев