Speechify добавила голосовой ввод и ассистента в расширение для Chrome
Сервис Speechify, известный как инструмент для озвучивания статей, PDF-файлов и документов, представил новые функции в своем расширении для браузера Chrome. Теперь пользователи могут использовать голосовой ввод текста и получать ответы от голосового ассистента.
В течение последнего года на рынке наблюдается бум инструментов голосового управления благодаря улучшению качества моделей распознавания речи. Speechify присоединилась к этому тренду, запустив собственный инструмент диктовки с поддержкой английского языка. Как и другие аналогичные решения, голосовой ввод от Speechify исправляет ошибки и удаляет слова-паразиты.
В ходе краткого тестирования выяснилось, что инструменту еще есть куда расти. Он хорошо работает с Gmail и Google Docs, но на таких платформах, как WordPress, могут возникать сложности с активацией диктовки. Компания заявила, что постепенно добавляет оптимизацию для популярных сайтов.
Что касается точности, то коэффициент ошибок при распознавании слов у Speechify оказался выше, чем у таких инструментов, как Wispr Flow, Willow и Monologue. В компании отметили, что их модель обучается быстрее по мере использования, и уровень ошибок будет постепенно снижаться.
Стартап также представил голосового ассистента, который размещается в боковой панели браузера. Пользователи могут задавать ему вопросы о содержимом веб-страницы, например: «Какие три ключевые идеи?» или «Объясни это проще».
Хотя у ChatGPT и Gemini тоже есть голосовые режимы, в Speechify считают, что там они являются второстепенной функцией. В своем решении компания сделала голос основным способом взаимодействия.
«Мы считаем, что чат всегда будет основным интерфейсом в ChatGPT и Gemini — этого ждут их пользователи. Голос для них всегда будет второстепенным. Наш многолетний опыт создания Speechify показывает, что значительная часть аудитории хочет, чтобы голос был основным и стандартным способом взаимодействия с ИИ», — пояснил Рохан Павулури, коммерческий директор компании.
Одним из ограничений является то, что ассистент Speechify пока не работает в браузерах со встроенными боковыми панелями, такими как Atlas от OpenAI, Comet от Perplexity и Dia. Однако стартап не слишком обеспокоен этим, поскольку расширение в первую очередь предназначено для Chrome и его огромной пользовательской базы.
Компания планирует постепенно внедрить как голосовой ввод, так и голосового ассистента во все свои приложения для настольных и мобильных платформ. В будущем Speechify также хочет разработать агентов, которые смогут выполнять задачи от имени пользователя, например, совершать звонки для записи на прием или ожидания в очереди службы поддержки.








0 комментариев