Глава ElevenLabs предсказывает, что ИИ-модели для аудио станут массовым товаром
Сооснователь и генеральный директор компании ElevenLabs Мати Станишевский заявил, что ИИ-модели для работы с аудио со временем станут массовым товаром. Это откровенное заявление прозвучало от руководителя компании, которая сегодня как раз и занимается их созданием.
Выступая на конференции TechCrunch Disrupt 2025 во вторник, основатель ElevenLabs поделился своим видением будущего аудио-ИИ как в краткосрочной, так и в долгосрочной перспективе.
Станишевский отметил, что исследователям его компании удалось решить некоторые проблемы с архитектурой моделей, и эта работа будет продолжаться в сфере аудио ещё год или два.
«В долгосрочной перспективе, в течение следующих нескольких лет, они станут массовым товаром, — сказал Станишевский. — Даже если будут различия — а я считаю, что для некоторых голосов и языков это будет правдой — сами по себе эти различия станут меньше».
На вопрос о том, зачем ElevenLabs сосредотачивается на создании моделей, если он верит в их неизбежную стандартизацию, Станишевский объяснил, что в краткосрочной перспективе они по-прежнему остаются «самым большим преимуществом и самым значительным прорывом, который можно совершить сегодня».
Например, если ИИ-голоса или взаимодействия звучат плохо, эту проблему всё ещё необходимо решать.
«Единственный способ решить это... — строить модели самостоятельно, а затем, в долгосрочной перспективе, появятся и другие игроки, которые тоже решат эту задачу», — сказал Станишевский.
Он также добавил, что те, кто ищет надёжные и масштабируемые варианты использования, вероятно, будут применять разные модели для разных задач.
Однако в ближайший год или два, по словам Станишевского, всё больше моделей перейдут на мультимодальные или комбинированные подходы.
«Таким образом, вы будете создавать аудио и видео одновременно или аудио и большие языковые модели одновременно в разговорном режиме», — пояснил он, приведя в пример модель Veo 3 от Google как образец того, чего можно достичь при объединении моделей.
Основатель ElevenLabs сообщил, что компания планирует запустить партнёрские программы с другими компаниями и работать с технологиями с открытым исходным кодом, чтобы объединить свои экспертные знания в области аудио с компетенциями других моделей.
По его словам, цель ElevenLabs — сосредоточиться как на создании моделей, так и на приложениях, чтобы создать долгосрочную ценность.
«Так же, как программное и аппаратное обеспечение были волшебством для Apple, мы считаем, что продукт и ИИ станут волшебством для поколения лучших вариантов использования», — добавил он.












0 комментариев