Компания Speechify, специализирующаяся на голосовом искусственном интеллекте, представила собственное нативное приложение для Windows, которое использует локально сохраненные модели для диктовки текста в различных программах и озвучивания статей, документов или PDF-файлов с помощью библиотеки голосов.
Об этом сообщает ProIT
Локальная обработка голоса на устройствах Windows
Новое приложение выполняет все процессы обработки голоса непосредственно на устройстве с Windows, особенно на ПК Copilot+, оснащенных NPU от AMD, Intel или Qualcomm, а также на других компьютерах с Windows 11 с графическими процессорами Intel и AMD. Это позволяет пользователям обеспечивать конфиденциальность и высокую производительность во время использования сервиса.
В программе работают три модели: нейронная технология преобразования текста в речь, система обнаружения голосовой активности в реальном времени и транскрипция, основанная на технологии Whisper. При необходимости пользователи могут настраивать переключение между локальными и облачными моделями во время работы с приложением.
Функциональные возможности и перспективы для бизнеса
Speechify рассказала, что нейросеть VITS Neural позволяет генерировать аудио в семи различных режимах скорости, так что приложение может озвучивать документы или веб-страницы с учетом потребностей пользователя. Для детекции голоса применяется открытая модель Silero.
“Более миллиарда людей на этой планете используют Windows. С этим запуском для Windows мы уверены, что чтение, а теперь и написание, никогда не станет преградой, независимо от того, какое устройство вы используете или как предпочитаете работать. Мы особенно рады возможности для бизнеса, учитывая, сколько профессионалов просили Speechify на своих ПК,” сказал Клифф Уэйтцман, основатель и генеральный директор Speechify, в заявлении.
За последний месяц компания выпустила функцию транскрипции встреч в стиле Granola, однако она была доступна только для встреч в браузере. Благодаря выходу кроссплатформенных приложений ожидается, что эта функция вскоре станет доступной и в нативных программах для транскрипции встреч в любых приложениях или браузерах.
До недавнего времени Speechify в основном специализировалась на синтезе речи из текста — например, для озвучивания статей, электронной почты или создания подкастов из документов. Однако сейчас компания стремится стать универсальным голосовым сервисом, внедряя диктовку, транскрипцию встреч и голосового помощника для пользователей.