OpenAI готовит важное обновление для голосового режима своего популярного чат-бота ChatGPT. В дальнейшем пользователям станет доступна возможность использовать голосовое общение без необходимости перехода к отдельному полноэкранному интерфейсу. Инновация позволит взаимодействовать с ChatGPT голосом прямо в стандартном окне чата, оставаясь в том же диалоге, где отображается текстовая информация.
Об этом сообщает ProIT
Новые возможности голосового режима ChatGPT
Ранее при активации голосового режима ChatGPT открывался отдельный экран с анимацией, где можно было видеть лишь расшифровку разговора в виде субтитров. Дополнительный контент, включая карты, погодные виджеты или изображения, был недоступен в этом режиме. Чтобы просмотреть такую информацию, пользователям приходилось завершать голосовую сессию и возвращаться к классическому чату.
В новой версии ChatGPT v1.2025.294 энтузиасты обнаружили изменения в коде, которые свидетельствуют о значительной трансформации функционала. Интерфейс голосового общения интегрируется непосредственно в обычное окно чата, что позволяет одновременно пользоваться как голосом, так и просматривать динамический контент, такой как карты, ссылки и другие визуальные элементы. Предусмотрены специальные кнопки для управления микрофоном и завершения разговора, что значительно повысит удобство взаимодействия.

Схожие решения на рынке
Стоит отметить, что схожая концепция уже внедрена компанией Google в продукте Gemini Live, где общение с искусственным интеллектом также интегрировано в единый интерфейс. Такой подход позволяет пользователям получать более разнообразный опыт взаимодействия с цифровыми ассистентами.
«OpenAI работает над усовершенствованием голосового режима ChatGPT – теперь он может стать частью обычного окна чата, а не отдельного полноэкранного интерфейса. Это позволит пользователям видеть различный контент во время разговора: погоду, карты, ссылки и другие визуальные элементы, которые ранее были недоступны в голосовом режиме».