Глава ElevenLabs предсказывает, что ИИ-модели для аудио станут массовым товаром

Сооснователь и генеральный директор компании ElevenLabs Мати Станишевский заявил, что ИИ-модели для работы с аудио со временем станут массовым товаром. Это откровенное заявление прозвучало от руководителя компании, которая сегодня как раз и занимается их созданием.

Выступая на конференции TechCrunch Disrupt 2025 во вторник, основатель ElevenLabs поделился своим видением будущего аудио-ИИ как в краткосрочной, так и в долгосрочной перспективе.

Станишевский отметил, что исследователям его компании удалось решить некоторые проблемы с архитектурой моделей, и эта работа будет продолжаться в сфере аудио ещё год или два.

«В долгосрочной перспективе, в течение следующих нескольких лет, они станут массовым товаром, — сказал Станишевский. — Даже если будут различия — а я считаю, что для некоторых голосов и языков это будет правдой — сами по себе эти различия станут меньше».

На вопрос о том, зачем ElevenLabs сосредотачивается на создании моделей, если он верит в их неизбежную стандартизацию, Станишевский объяснил, что в краткосрочной перспективе они по-прежнему остаются «самым большим преимуществом и самым значительным прорывом, который можно совершить сегодня».

Например, если ИИ-голоса или взаимодействия звучат плохо, эту проблему всё ещё необходимо решать.

«Единственный способ решить это... — строить модели самостоятельно, а затем, в долгосрочной перспективе, появятся и другие игроки, которые тоже решат эту задачу», — сказал Станишевский.

Он также добавил, что те, кто ищет надёжные и масштабируемые варианты использования, вероятно, будут применять разные модели для разных задач.

Однако в ближайший год или два, по словам Станишевского, всё больше моделей перейдут на мультимодальные или комбинированные подходы.

«Таким образом, вы будете создавать аудио и видео одновременно или аудио и большие языковые модели одновременно в разговорном режиме», — пояснил он, приведя в пример модель Veo 3 от Google как образец того, чего можно достичь при объединении моделей.

Основатель ElevenLabs сообщил, что компания планирует запустить партнёрские программы с другими компаниями и работать с технологиями с открытым исходным кодом, чтобы объединить свои экспертные знания в области аудио с компетенциями других моделей.

По его словам, цель ElevenLabs — сосредоточиться как на создании моделей, так и на приложениях, чтобы создать долгосрочную ценность.

«Так же, как программное и аппаратное обеспечение были волшебством для Apple, мы считаем, что продукт и ИИ станут волшебством для поколения лучших вариантов использования», — добавил он.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Все комментарии - Технологии