Xiaomi представила мощную языковую модель MiMo-V2-Flash
Компания Xiaomi представила свою самую продвинутую на сегодняшний день открытую языковую модель MiMo-V2-Flash. Новая модель, позиционируемая как конкурент DeepSeek V3.2 и Claude 4.5 Sonnet, ориентирована на высокую скорость работы и эффективную архитектуру, с сильными возможностями в логических рассуждениях и генерации кода.
MiMo-V2-Flash — это модель типа Mixture-of-Experts (MoE) с общим числом параметров 309 миллиардов, из которых активно используется 15 миллиардов. Она предназначена для сценариев с AI-агентами и многоходовыми диалогами, требующими быстрого вывода. Модель использует гибридную архитектуру внимания с нативным контекстом в 32 000 токенов и поддержкой до 256 000 токенов.
По заявлению Xiaomi, модель генерирует ответы быстрее, чем многие ведущие аналоги, включая DeepSeek и Claude, при значительно более низкой стоимости эксплуатации. В тестах на логику, таких как AIME 2025 и GPQA-Diamond, модель входит в топ-2 среди открытых решений. В инженерных бенчмарках, например SWE-Bench, она показывает результаты, сопоставимые с GPT-5 и Claude 4.5 Sonnet.
Стоимость использования API составляет $0.1 (около 8 руб.) за миллион входных токенов и $0.3 (около 24 руб.) за миллион выходных. На старте API доступен бесплатно в течение ограниченного времени. Скорость генерации достигает 150 токенов в секунду.
Архитектура модели включает технологию Multi-Token Prediction (MTP), которая позволяет генерировать и проверять несколько токенов параллельно, ускоряя декодирование в 2–2,6 раза. Для обучения применяется новый метод Multi-Teacher Online Policy Distillation (MOPD), который, по данным компании, позволяет достичь высокой производительности, используя менее 1/50 ресурсов традиционного обучения с подкреплением.
Для взаимодействия с моделью Xiaomi запустила веб-интерфейс MiMo Studio (aistudio.xiaomimimo.com), поддерживающий веб-поиск, работу с агентами и генерацию кода. Модель способна создавать функциональные HTML-страницы и интегрируется с инструментами разработки.
MiMo-V2-Flash полностью открыта под лицензией MIT. Веса модели доступны на Hugging Face, а код для вывода — на GitHub. Этот шаг отражает стремление Xiaomi укрепить свои позиции на рынке ИИ, предлагая разработчикам прозрачный и недорогой доступ к мощным инструментам.











0 комментариев