Китайские модели ИИ обошли западных гигантов в визуальном анализе
Опубликованы результаты февральского рейтинга SuperCLUE-VLM, оценивающего китайские мультимодальные модели визуального языка. В тестировании участвовали 14 ведущих моделей со всего мира.
Результаты показали, что традиционные западные гиганты столкнулись с серьёзной конкуренцией, в то время как китайские модели совершили коллективный прорыв и продемонстрировали превосходство.
Оценка проводилась по трём основным направлениям: базовое восприятие, визуальное мышление и практическое применение, где ключевым критерием была точность ответов.
Согласно рейтингу, модель Gemini-3.1-Pro-Preview от Google с результатом 84.87 балла уверенно заняла первое место в мире, но китайские модели значительно сократили отставание.
Модель Doubao-Seed-2.0-Pro-260215 от ByteDance с 81.20 балла возглавила китайский сегмент. За ней следуют Qwen3.5-Plus-Thinking от Alibaba (80.24 балла) и Kimi-K2.5-Thinking от Moonshot AI (79.95 балла), вместе составившие первую лидерскую группу.
В то же время основные западные модели показали более скромные результаты: GPT-5.2 (high) от OpenAI набрала лишь 73.31 балла, а Claude-Opus-4.6 (high effort) от Anthropic — 72.99 балла. Обе модели оказались в середине таблицы, уступив многим китайским конкурентам, таким как SenseNova 6.5 Pro-20251215 от SenseTime и ERNIE-5.0 от Baidu.
Особого внимания заслуживают успехи открытых (open-source) моделей. Решения от Alibaba и Moonshot AI вошли в топ, что нарушило монополию закрытых моделей на лидерские позиции.
Рейтинг наглядно демонстрирует стремительный прогресс китайских разработчиков в области мультимодальных визуальных технологий. Адаптивность и общая эффективность местных моделей в китайскоязычном контексте продолжают расти, значительно усиливая их глобальную конкурентоспособность.







0 комментариев