Xiaomi представила флагманскую языковую модель MiMo-V2-Pro с более чем 1 ТБ параметров

19 марта 2026, 05:52 / Технологии → Новости / Технологии

Xiaomi продолжает уверенное продвижение в сфере больших языковых моделей (LLM). После представления MiMo-7B в мае 2025 года и последующего выпуска MiMo-V2-Flash в декабре, компания объявила о трёх новых моделях: MiMo-V2-Pro, MiMo-V2-Omni и MiMo-V2-TTS.

Все три модели уже интегрируются в собственную экосистему Xiaomi, включая MiMo Studio, Xiaomi Browser и Kingsoft Office, а также доступны через инструменты для разработчиков, такие как OpenClaw, OpenCode и Cline. Для разработчиков также доступна бесплатная недельная пробная версия.

Xiaomi MiMo-V2-Pro

Главной новинкой является MiMo-V2-Pro, которую Xiaomi позиционирует как свой флагман для так называемой «эпохи агентов». Она создана для сложных рабочих нагрузок в реальном мире, имеет более 1 ТБ общих параметров и окно контекста размером 1 МБ.

Xiaomi утверждает, что MiMo-V2-Pro может справляться со сложными задачами, такими как оркестрация рабочих процессов и долгосрочное планирование, без участия человека, особенно в рамках агентских систем. Компания также заявляет, что её производительность близка к таким моделям, как Claude Opus 4.6, при этом стоимость использования через API значительно ниже. Цена начинается от 1 доллара США (~80 руб.) за миллион токенов для ввода в небольших контекстах, увеличиваясь для более крупных.

Модель интегрирована в инструменты Kingsoft WPS Office, где она может работать с документами Word, Excel, PowerPoint и PDF.

Xiaomi MiMo-V2-Omni и MiMo-V2-TTS

MiMo-V2-Omni использует другой подход, фокусируясь на мультимодальных задачах. Она предназначена для совместной обработки аудио, изображений и видео, причём Xiaomi заявляет о высокой производительности в таких областях, как понимание аудио и визуальное мышление.

Модель может обрабатывать длинные аудиовходы, сценарии с несколькими говорящими и совместный анализ аудио и видео, что указывает на более широкие области применения, выходящие за рамки текста. Xiaomi утверждает, что её способность понимать аудио в некоторых случаях даже превосходит модели вроде Gemini 3 Pro.

Тем временем, MiMo-V2-TTS — это модель синтеза речи от Xiaomi. В ней можно детально настраивать тон, эмоции и стиль речи. По словам компании, она может справляться со всем: от естественного разговора до пения, с поддержкой нескольких китайских диалектов.

Все три модели уже доступны через API-платформу Xiaomi по относительно агрессивным ценам. Большинство крупных технологических компаний строят аналогичные стеки текстовых, мультимодальных и голосовых моделей. Примечательно, насколько быстро Xiaomi выпускает обновления и насколько плотно эти модели вплетаются в её существующую программную экосистему.

ИИ: Выход MiMo-V2-Pro демонстрирует, что гонка в области ИИ становится всё более интенсивной, и крупные технологические компании стремятся не просто создавать модели, а глубоко интегрировать их в свои продукты, создавая замкнутую экосистему. Агрессивное ценообразование может стать серьёзным фактором для разработчиков, выбирающих платформу.