Компания DeepL, известная своими решениями для перевода текстов, представила новый комплексный инструмент для голосового перевода в реальном времени. Сервис охватывает разнообразные сценарии использования: от онлайн-встреч и мобильных переговоров до групповых разговоров для сотрудников на передовой с помощью специализированных приложений. Кроме того, DeepL открывает API, который позволяет сторонним разработчикам и бизнесу внедрять индивидуальные сценарии, например, для работы кол-центров.
Об этом сообщает ProIT
Новые инструменты для бизнеса и корпоративных обсуждений
DeepL готовит приложения для платформ Zoom и Microsoft Teams, где слушатели могут получать синхронный перевод во время разговора на разных языках или читать переведенные тексты на экране. Программа находится на этапе раннего доступа, а компания приглашает организации присоединяться к списку ожидания. Кроме того, DeepL предлагает продукты для мобильных устройств и веб-интерфейсов, которые поддерживают как личные, так и дистанционные коммуникации.
Инновации и конкуренция на рынке голосовых переводов
Новый инструмент от DeepL позволяет проводить групповые обсуждения на тренингах или воркшопах, где участники могут присоединяться через QR-код. Система также способна адаптироваться к специализированной терминологии, в том числе к отраслевым терминам, названиям компаний и личным именам.
“После стольких лет в текстовом переводе, голосовой перевод был для нас естественным шагом,” рассказал CEO DeepL Ярек Кутыловский в интервью TechCrunch. “Мы прошли долгий путь в области текстового перевода и перевода документов. Но мы считали, что на рынке нет хорошего продукта для голосового перевода в реальном времени”.
По словам генерального директора DeepL Ярека Кутыловского, главной сложностью разработки продукта является баланс между уменьшением задержки во время перевода и сохранением точности результата. Он отмечает, что благодаря многолетнему опыту в сфере текстового перевода, компания имеет преимущество в качестве обработки языковых данных.
DeepL контролирует полный цикл голосового перевода: сначала речь преобразуется в текст, затем переводится, а после этого снова озвучивается. Однако в будущем компания планирует создать модель, которая обеспечит прямой голосовой перевод без промежуточного текстового этапа.
Среди конкурентов DeepL выделяются такие проекты, как Sanas, которая с помощью искусственного интеллекта изменяет акцент собеседника в режиме реального времени — эта технология уже привлекла значительные инвестиции. Дубайская компания Camb.AI ориентируется на медиа и развлекательные сервисы, помогая локализовать видеоконтент в больших объемах. Стартап Palabra, поддержанный фондом Seven Seven Six соучредителя Reddit Алексиса Оганяна, работает над собственной системой перевода речи, которая сохраняет не только содержание, но и уникальные черты голоса оратора.
Такие технологии открывают новые возможности для компаний в сфере обслуживания клиентов, позволяя преодолевать языковые барьеры там, где найти квалифицированных многоязычных сотрудников сложно и дорого, а также повышают качество коммуникации в глобальной бизнес-среде.