Более года назад компания OpenAI представила революционную функцию для своего чат-бота ChatGPT – Voice Engine. Эта технология искусственного интеллекта позволяет клонировать человеческий голос на основе короткой 15-секундной аудиозаписи. Несмотря на большой потенциал, эта разработка так и не стала доступной для широкой аудитории. Как стало известно, причины этого связаны с вопросами безопасности и этики.
Об этом сообщает ProIT
За время своего существования ChatGPT получил множество обновлений и новых возможностей, впечатляя пользователей способностью генерировать развернутые ответы, создавать детализированные отчеты, обрабатывать изображения и просматривать веб-страницы. Однако голосовая технология Voice Engine, несмотря на первоначальные планы интеграции в ChatGPT или ее выпуск в качестве отдельного инструмента, остается в ограниченном доступе для избранных партнеров.
Ограничение доступа из-за этических рисков
Причины такой осторожности объясняются рисками, связанными с технологией клонирования голоса. Эксперты предупреждают, что возможность создания аутентичных копий голосов может привести к злоупотреблениям. Это касается не только фейковых аудиозаписей политиков или знаменитостей, но и мошенничества, которое может осуществляться с помощью клонированных голосов близких людей.
Примером таких злоупотреблений являются дипфейки, которые стали распространенными после внедрения функции генерации изображений в ChatGPT. Свободный доступ к Voice Engine с подобными мерами контроля мог бы значительно упростить злоумышленникам реализацию мошеннических схем.
Потенциал и будущее технологии
В то же время технология клонирования голоса имеет потенциально полезные применения. Среди них – дубляж фильмов, помощь людям с нарушениями речи, а также возможность перевода разговорной речи в реальном времени. Однако опасения по поводу возможных злоупотреблений в настоящее время преобладают.
OpenAI продолжает тестировать Voice Engine с ограниченным кругом партнеров, исследуя различные варианты его использования, от логопедии до создания голосов для виртуальных персонажей.
По информации, OpenAI планировала выпустить Voice Engine в виде API под названием Custom Voices в марте 2024 года. Однако из-за роста мошенничества, связанного с клонированием голоса, компания придерживается осторожной позиции относительно его широкого распространения. Вопрос о доступности Voice Engine для широкой аудитории остается открытым, но очевидно, что это произойдет лишь после внедрения надежных механизмов защиты от злоупотреблений.