Microsoft представила три новые базовые модели ИИ для генерации текста, голоса и видео
Исследовательское подразделение Microsoft AI в четверг, 3 апреля 2026 года, объявило о выпуске трёх новых базовых моделей искусственного интеллекта, способных генерировать текст, голос и изображения. Этот шаг демонстрирует стремление компании развивать собственный стек мультимодальных ИИ и конкурировать с другими лабораториями, несмотря на сохраняющееся партнёрство с OpenAI.
Модель MAI-Transcribe-1 транскрибирует речь на 25 различных языках в текст и, по заявлению Microsoft, работает в 2,5 раза быстрее, чем её предыдущее предложение Azure Fast. MAI-Voice-1 — это аудиогенерирующая модель, которая позволяет создавать 60 секунд аудио за одну секунду, включая возможность создания пользовательского голоса. MAI-Image-2 является моделью для генерации видео.
MAI-Image-2 была первоначально представлена в MAI Playground (новом ПО для тестирования больших языковых моделей) 19 марта. Теперь все три модели выпускаются на платформе Microsoft Foundry, а модели для транскрибации и генерации голоса также доступны в MAI Playground.
Модели были разработаны командой MAI Superintelligence под руководством генерального директора Microsoft AI Мустафы Сулеймана, которая была сформирована и анонсирована в ноябре 2025 года.
В Microsoft AI мы создаём гуманистический ИИ. У нас особый взгляд на создание наших моделей ИИ — мы ставим человека в центр, оптимизируем под то, как люди на самом деле общаются, обучаем для практического использования, — написал Сулейман в блоге. — Вскоре вы увидите больше наших моделей в Foundry и непосредственно в продуктах и сервисах Microsoft.
В перенасыщенном рынке больших языковых моделей (LLM) компания надеется, что конкурентным преимуществом её моделей станет более низкая стоимость по сравнению с предложениями Google и OpenAI.
Цены на использование моделей начинаются с $0.36 (~29 рублей) в час для MAI-Transcribe-1, $22 (~1760 рублей) за 1 миллион символов для MAI-Voice-1 и $5 (~400 рублей) за 1 миллион токенов для текстового ввода и $33 (~2640 рублей) за 1 миллион токенов для вывода изображений в MAI-Image-2.
Несмотря на выпуск собственных моделей, Сулейман подтвердил приверженность Microsoft партнёрству с OpenAI. При этом недавнее перезаключение соглашения между компаниями позволило Microsoft в полной мере заняться исследованиями в области сверхинтеллекта.
Microsoft инвестировала в OpenAI более $13 миллиардов и размещает её модели в своих продуктах в рамках многолетнего партнёрства. Аналогичную стратегию компания применяет и к чипам, как производя собственные, так и закупая их у сторонних производителей.
ИИ: Выход этих моделей — важный шаг в стратегии Microsoft по диверсификации своих возможностей в области ИИ. Хотя партнёрство с OpenAI остаётся краеугольным камнем, развитие собственного стека моделей даёт Microsoft больше независимости и рычагов влияния на быстро меняющемся рынке генеративного искусственного интеллекта. Особенно интересен акцент на «гуманистическом ИИ» и практической применимости, что может стать ответом на критику в адрес существующих моделей.







0 комментариев