OpenAI интегрирует голосовой режим ChatGPT в основной чат для удобства пользователей

|
OpenAI интегрирует голосовой режим ChatGPT в основной чат для удобства пользователей

OpenAI готовит важное обновление для голосового режима своего популярного чат-бота ChatGPT. В дальнейшем пользователям станет доступна возможность использовать голосовое общение без необходимости перехода к отдельному полноэкранному интерфейсу. Инновация позволит взаимодействовать с ChatGPT голосом прямо в стандартном окне чата, оставаясь в том же диалоге, где отображается текстовая информация.

Об этом сообщает ProIT

Новые возможности голосового режима ChatGPT

Ранее при активации голосового режима ChatGPT открывался отдельный экран с анимацией, где можно было видеть лишь расшифровку разговора в виде субтитров. Дополнительный контент, включая карты, погодные виджеты или изображения, был недоступен в этом режиме. Чтобы просмотреть такую информацию, пользователям приходилось завершать голосовую сессию и возвращаться к классическому чату.

В новой версии ChatGPT v1.2025.294 энтузиасты обнаружили изменения в коде, которые свидетельствуют о значительной трансформации функционала. Интерфейс голосового общения интегрируется непосредственно в обычное окно чата, что позволяет одновременно пользоваться как голосом, так и просматривать динамический контент, такой как карты, ссылки и другие визуальные элементы. Предусмотрены специальные кнопки для управления микрофоном и завершения разговора, что значительно повысит удобство взаимодействия.

OpenAI ChatGPT Voice Mode

Схожие решения на рынке

Стоит отметить, что схожая концепция уже внедрена компанией Google в продукте Gemini Live, где общение с искусственным интеллектом также интегрировано в единый интерфейс. Такой подход позволяет пользователям получать более разнообразный опыт взаимодействия с цифровыми ассистентами.

«OpenAI работает над усовершенствованием голосового режима ChatGPT – теперь он может стать частью обычного окна чата, а не отдельного полноэкранного интерфейса. Это позволит пользователям видеть различный контент во время разговора: погоду, карты, ссылки и другие визуальные элементы, которые ранее были недоступны в голосовом режиме».