Рейтинг больших языковых моделей для китайского языка: лидируют зарубежные, но китайские показывают хорошие результаты

/ ТехнологииНовости / Технологии

Сегодня организация SuperCLUE опубликовала ежегодный отчёт за 2025 год о бенчмарке больших языковых моделей для китайского языка.

В оценке приняли участие 23 модели из Китая и других стран, которые были протестированы по шести ключевым направлениям: математические рассуждения, научные рассуждения, генерация кода и другим.

Результаты показывают, что лидирующие позиции по-прежнему занимают зарубежные проприетарные модели. Модель Claude-Opus-4.5-Reasoning от компании Anthropic набрала 68.25 баллов и заняла первое место.

За ней следуют Gemini-3-Pro-Preview от Google с 65.59 баллами и GPT-5.2(high) от OpenAI с 64.32 баллами, замкнув тройку лидеров.

Однако китайские модели активно сокращают отставание. Лучшая китайская открытая модель Kimi-K2.5-Thinking и лучшая проприетарная модель Qwen3-Max-Thinking (千问3-Max-Thinking) набрали 61.50 и 60.61 баллов, заняв четвёртое и шестое места в мировом рейтинге соответственно.

В некоторых узких задачах китайские модели показали выдающиеся результаты. Например, Kimi-K2.5-Thinking заняла первое место в задаче генерации кода с 53.33 баллами, а Qwen3-Max-Thinking в задаче математических рассуждений набрала 80.87 баллов, разделив первое место с моделью Gemini-3-Pro-Preview от Google.

В целом, наблюдается значительная разница между открытыми и проприетарными моделями внутри Китая и за его пределами. В проприетарном сегменте лидируют зарубежные разработки, а китайские модели их догоняют. В открытом сегменте, наоборот, доминируют китайские модели, в то время как зарубежные отстают: пять лучших китайских открытых моделей существенно опережают зарубежные аналоги.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ в комментариях

Вы можете задать вопрос нашему ИИ-помощнику прямо в комментариях к этой статье. Он постарается быстро ответить или уточнить информацию.

⚠️ ИИ может ошибаться — проверяйте важную информацию.


0 комментариев

Оставить комментарий


Все комментарии - Технологии