Тенцент выпустила в открытый доступ языковую модель Hy3 с приростом производительности до 40%
Китайский интернет-гигант Tencent, который ранее отставал в гонке больших языковых моделей, совершил рывок. После привлечения ведущего специалиста Яо Шуньюя (Yao Shunyu) с зарплатой в сотни миллионов юаней, компания представила новое поколение своей модели — Hunyuan 3.0 (Hy3). Модель уже доступна для бесплатного использования на платформе OpenRouter.
Модель Tencent Hunyuan 3.0, представленная под названием Hy3 preview, относится к архитектуре MoE (Mixture of Experts — смесь экспертов). Она предлагает три уровня вычислительной мощности, длину контекста в 262 тысячи токенов и скорость генерации около 23 токенов в секунду. Подробные технические спецификации пока не раскрыты.
В отличие от мультимодальной Hunyuan 2.0, новая версия 3.0 на текущем этапе является текстовой. Хотя официальных данных о производительности нет, пользователи провели независимое тестирование на бенчмарке SWE-Bench, оценивающем способности к программированию.

Результаты показывают, что если Hy2 набрала 53.0%, то Hy3 preview демонстрирует результат в 74.4%. Это означает прирост производительности в программировании более чем на 40%. Уровень новой модели приближается к GLM-4.7, хотя до лидеров рынка, таких как GLM-5 и текущего эталона Opus 4.6, ещё есть расстояние.
Тем не менее, очевидно, что с приходом Яо Шуньюя разработки Tencent в области ИИ вышли на новый уровень. Модель Hy3 уже вошла в число лучших на внутреннем китайском рынке, что подтверждает слухи о том, что эксперт привнесёт в компанию исследовательские компетенции уровня OpenAI.
Hunyuan 3.0 также появилась в приложении Tencent Yuanbao. Ожидается, что официальный релиз состоится на этой неделе, что может привести к прямому «столкновению» с другой ожидаемой новинкой — моделью DeepSeek V4.








0 комментариев