Speechify внедряет голосовой набор и голосового ассистента в расширение Chrome

|
Speechify внедряет голосовой набор и голосового ассистента в расширение Chrome

Сервис Speechify, ранее известный как инструмент для прослушивания статей, PDF-файлов и документов, анонсировал расширение функциональности своего расширения для Chrome. Теперь пользователи получают доступ к голосовому набору текста и интерактивному голосовому ассистенту, способному отвечать на вопросы о содержании страницы.

Об этом сообщает ProIT

Голосовой ввод и ассистент: новые возможности Speechify

В последний год наблюдается динамичное развитие технологий распознавания голоса, и Speechify активно участвует в этой тенденции, представляя собственный англоязычный диктантный инструмент. Голосовой ввод автоматически исправляет ошибки и устраняет лишние слова, что упрощает создание текстов. Однако тестирование показало, что в настоящее время сервис работает лучше всего на таких платформах, как Gmail и Google Docs. На других ресурсах, например, WordPress, пользователи могут столкнуться с трудностями при активации голосового диктанта. Компания постепенно добавляет оптимизацию для популярных сайтов.

Что касается точности, уровень ошибок в Speechify выше, чем у конкурентов, таких как Wispr Flow, Willow и Monologue. Тем не менее, модель компании способна к самообучению — чем больше вы используете сервис, тем ниже становится процент ошибок.

Интерактивный ассистент в браузере

Speechify также представил голосового ассистента, который работает в боковой панели браузера Chrome. Пользователь может обратиться к нему с вопросами о содержании сайта, например: «Какие три ключевые идеи?» или «Объясни простыми словами».

«Мы считаем, что чат всегда будет основным пользовательским опытом в ChatGPT и Gemini, когда вы открываете приложения. Это то, что ожидают их пользователи. Голос всегда будет второстепенным — и во многих случаях, после мысли для ChatGPT и Gemini. Мы знаем из нескольких лет работы над Speechify, что существует большая часть рынка, включая наших пользователей, которые хотят, чтобы голос был основным, стандартным параметром каждый раз, когда они открывают приложение и общаются с ИИ,» — сказал Рохан Павулури, главный бизнес-офицер компании, в письме TechCrunch.

Часть конкурентов, таких как ChatGPT и Gemini, разработчики Speechify считают ориентированными прежде всего на текстовый чат, тогда как голос является лишь дополнительной функцией. В Speechify же делают акцент именно на голосовом взаимодействии с ассистентом.

Стоит отметить, что в настоящее время голосовой ассистент Speechify не работает в браузерах с уже встроенными боковыми помощниками, таких как OpenAI Atlas, Perplexity Comet или Dia. Однако команда сервиса сосредоточена именно на пользователях Chrome — одной из самых массовых платформ.

В планах компании — распространить функции голосового набора и ассистента на все свои приложения для компьютеров и мобильных устройств. Кроме того, Speechify стремится разработать «агентов», которые будут выполнять задачи вместо пользователя, например, осуществлять звонки для записи на прием или ожидать на линии службы поддержки. Подобными сервисами занимаются и другие игроки, в частности Truecaller и Cloacked.