Microsoft представила три новые базовые модели ИИ для генерации текста, голоса и видео

Исследовательское подразделение Microsoft AI в четверг, 3 апреля 2026 года, объявило о выпуске трёх новых базовых моделей искусственного интеллекта, способных генерировать текст, голос и изображения. Этот шаг демонстрирует стремление компании развивать собственный стек мультимодальных ИИ и конкурировать с другими лабораториями, несмотря на сохраняющееся партнёрство с OpenAI.

Модель MAI-Transcribe-1 транскрибирует речь на 25 различных языках в текст и, по заявлению Microsoft, работает в 2,5 раза быстрее, чем её предыдущее предложение Azure Fast. MAI-Voice-1 — это аудиогенерирующая модель, которая позволяет создавать 60 секунд аудио за одну секунду, включая возможность создания пользовательского голоса. MAI-Image-2 является моделью для генерации видео.

MAI-Image-2 была первоначально представлена в MAI Playground (новом ПО для тестирования больших языковых моделей) 19 марта. Теперь все три модели выпускаются на платформе Microsoft Foundry, а модели для транскрибации и генерации голоса также доступны в MAI Playground.

Модели были разработаны командой MAI Superintelligence под руководством генерального директора Microsoft AI Мустафы Сулеймана, которая была сформирована и анонсирована в ноябре 2025 года.

В Microsoft AI мы создаём гуманистический ИИ. У нас особый взгляд на создание наших моделей ИИ — мы ставим человека в центр, оптимизируем под то, как люди на самом деле общаются, обучаем для практического использования, — написал Сулейман в блоге. — Вскоре вы увидите больше наших моделей в Foundry и непосредственно в продуктах и сервисах Microsoft.

В перенасыщенном рынке больших языковых моделей (LLM) компания надеется, что конкурентным преимуществом её моделей станет более низкая стоимость по сравнению с предложениями Google и OpenAI.

Цены на использование моделей начинаются с $0.36 (~29 рублей) в час для MAI-Transcribe-1, $22 (~1760 рублей) за 1 миллион символов для MAI-Voice-1 и $5 (~400 рублей) за 1 миллион токенов для текстового ввода и $33 (~2640 рублей) за 1 миллион токенов для вывода изображений в MAI-Image-2.

Несмотря на выпуск собственных моделей, Сулейман подтвердил приверженность Microsoft партнёрству с OpenAI. При этом недавнее перезаключение соглашения между компаниями позволило Microsoft в полной мере заняться исследованиями в области сверхинтеллекта.

Microsoft инвестировала в OpenAI более $13 миллиардов и размещает её модели в своих продуктах в рамках многолетнего партнёрства. Аналогичную стратегию компания применяет и к чипам, как производя собственные, так и закупая их у сторонних производителей.

ИИ: Выход этих моделей — важный шаг в стратегии Microsoft по диверсификации своих возможностей в области ИИ. Хотя партнёрство с OpenAI остаётся краеугольным камнем, развитие собственного стека моделей даёт Microsoft больше независимости и рычагов влияния на быстро меняющемся рынке генеративного искусственного интеллекта. Особенно интересен акцент на «гуманистическом ИИ» и практической применимости, что может стать ответом на критику в адрес существующих моделей.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии