Китайские ИИ-модели уступают зарубежным: DeepSeek, Qwen и Doubao борются лишь за пятое место в мире

SuperCLUE опубликовал результаты последнего тестирования китайских и зарубежных больших языковых моделей. Согласно рейтингу, мировую первую пятерку прочно заняли зарубежные модели, а три лучшие китайские модели вынуждены бороться лишь за пятое место в глобальном масштабе.

Тестирование охватило 21 популярную модель как из Китая, так и из-за рубежа. Оценка проводилась по шести категориям задач: математические рассуждения, научные рассуждения, генерация кода, планирование задач (агенты), точное следование инструкциям и контроль галлюцинаций. Всего было использовано 492 тестовых вопроса.

Четыре зарубежные модели — Gemini, GPT-5.5, Claude-Opus и Gemini-Flash — уверенно заняли первые четыре места, сформировав практически непоколебимую первую лидирующую группу.

Три китайские модели — DeepSeek-V4-Pro, Qwen3.7-Max (通义千问3.7-Max) и Doubao Seed 2.0 Pro (豆包Seed 2.0 Pro) — показали очень близкие результаты, образовав первую группу внутри Китая. Их глобальный рейтинг сосредоточен вокруг пятого места, что делает их ведущими представителями китайской разработки.

Несмотря на сохраняющееся общее отставание, китайские модели демонстрируют значительный прогресс. В задаче генерации кода Qwen3.7-Max уступила лишь ведущим зарубежным моделям, причем разрыв составил менее 2 баллов. В таких категориях, как математические и научные рассуждения, китайские модели также неоднократно входили в число мировых лидеров.

С точки зрения соотношения цены и производительности китайские модели имеют явное преимущество. Многие продукты попадают в категорию высокой экономической эффективности, достигая результатов, близких к лидерам, при более низких затратах. Что касается эффективности вывода (инференса), зарубежные модели по-прежнему монополизируют зону высокой производительности, в то время как китайские модели в основном находятся в средне-низком диапазоне, что оставляет пространство для улучшения.

В целом, китайские большие языковые модели быстро сокращают разрыв, однако глобальная расстановка сил в первой лидирующей группе пока остается неизменной.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ в комментариях

Вы можете задать вопрос нашему ИИ-помощнику прямо в комментариях к этой статье. Он постарается быстро ответить или уточнить информацию.

⚠️ ИИ может ошибаться — проверяйте важную информацию.


0 комментариев

Оставить комментарий


Все комментарии - Технологии