DeepL представила систему перевода речи в реальном времени для бизнеса
Компания DeepL, известная своими высококачественными инструментами для перевода текста, сегодня представила комплексное решение для перевода речи в реальном времени. Новая система предназначена для использования в деловых встречах, мобильных и веб-разговорах, а также для групповых бесед сотрудников на передовой через специальные приложения. Компания также выпускает API, позволяющий сторонним разработчикам и бизнесам создавать собственные решения на базе технологии DeepL, например, для колл-центров.
«После стольких лет работы с переводом текста, голос стал для нас естественным следующим шагом, — заявил в интервью TechCrunch генеральный директор DeepL Ярек Кутыловски. — Мы прошли долгий путь в переводе текстов и документов. Но мы считали, что на рынке нет отличного продукта для перевода речи в реальном времени».
Кутыловски отметил, что основная сложность при создании такого продукта заключается в поиске баланса между сокращением задержки (времени между произнесением фразы и воспроизведением перевода) и сохранением точности результата.
DeepL выпускает плагины для таких платформ, как Zoom и Microsoft Teams. Слушатели смогут либо слышать перевод в реальном времени, пока другие говорят на родных языках, либо следить за переводом в виде текста на экране. В настоящее время эта программа находится на стадии раннего доступа, и компания приглашает организации присоединиться к листу ожидания. Также у компании есть продукт для мобильных и веб-разговоров, которые могут проходить лично или удалённо.
DeepL позволяет пользователям участвовать в групповых беседах, например, на тренингах или воркшопах, присоединяясь к сессии через QR-код.
Компания заявляет, что её технология перевода речи также способна обучаться и адаптироваться к специальной лексике, такой как отраслевые термины, названия компаний и личные имена.
Кутыловски считает, что искусственный интеллект меняет представление о том, как будет выглядеть клиентский сервис в ближайшие годы. Он отметил, что слой перевода помогает компаниям оказывать поддержку на языках, где квалифицированных сотрудников мало и их наём обходится дорого.
Компания утверждает, что контролирует весь стек технологий для перевода речи. Однако текущая система сначала преобразует речь в текст, применяет перевод, а затем преобразует результат обратно в речь. DeepL уверена, что многолетний опыт работы с переводом текста даёт ей преимущество в качестве. В будущем компания хочет разработать сквозную модель перевода речи, которая полностью пропускает текстовый этап.
DeepL сталкивается с конкуренцией со стороны нескольких хорошо финансируемых стартапов, работающих в смежных областях. Например, Sanas, которая в прошлом году привлекла 65 млн долларов (~5.2 млрд рублей) от Quadrille Capital и Teleperformance, использует ИИ для изменения акцента говорящего в реальном времени — инструмент, в первую очередь предназначенный для операторов колл-центров.
Дубайская Camb.AI фокусируется на синтезе речи и переводе для медиакомпаний и развлекательных гигантов, таких как Amazon Web Services, помогая им дублировать и локализовать видеоконтент в больших масштабах.
Palabra, поддерживаемая фирмой Seven Seven Six сооснователя Reddit Алексиса Оганяна, создаёт движок для перевода речи в реальном времени, предназначенный для сохранения как смысла, так и оригинального голоса говорящего, что ставит её в более прямую конкуренцию с тем, что сейчас строит DeepL.
ИИ: Выход DeepL на рынок перевода речи в реальном времени — логичный и ожидаемый шаг, который может серьёзно изменить правила игры для международного бизнеса и удалённой работы. Особенно интересен их подход с полным контролем над технологическим стеком и планы по созданию сквозной модели, что потенциально может снизить задержки. Конкуренция в этой сфере уже высока, и борьба за качество и скорость перевода будет только нарастать.







0 комментариев