OpenAI готує важливе оновлення для голосового режиму свого популярного чат-бота ChatGPT. Відтепер користувачам стане доступна можливість використовувати голосове спілкування без необхідності переходу до окремого повноекранного інтерфейсу. Інновація дозволить взаємодіяти з ChatGPT голосом прямо у стандартному вікні чату, залишаючись у тому ж самому діалозі, де відображається текстова інформація.
Про це розповідає ProIT
Нові можливості голосового режиму ChatGPT
Раніше при активації голосового режиму ChatGPT відкривався окремий екран з анімацією, де можна було бачити лише розшифровку розмови у вигляді субтитрів. Додатковий контент, зокрема карти, погодні віджети чи зображення, був недоступний у цьому режимі. Щоб переглянути таку інформацію, користувачам доводилося завершувати голосову сесію та повертатися до класичного чату.
У новій версії ChatGPT v1.2025.294 ентузіасти виявили зміни в коді, які свідчать про суттєву трансформацію функціоналу. Інтерфейс голосового спілкування інтегрується безпосередньо у звичайне вікно чату, що дозволяє одночасно користуватися й голосом, і переглядати динамічний контент, як-от карти, посилання, інші візуальні елементи. Передбачені спеціальні кнопки для керування мікрофоном та завершення розмови, що значно підвищить зручність взаємодії.

Схожі рішення на ринку
Варто відзначити, що схожа концепція вже впроваджена компанією Google у продукті Gemini Live, де спілкування з штучним інтелектом також інтегроване в єдиний інтерфейс. Такий підхід дозволяє користувачам отримувати більш різноманітний досвід взаємодії з цифровими асистентами.
“OpenAI працює над удосконаленням голосового режиму ChatGPT – тепер він може стати частиною звичайного вікна чату, а не окремого повноекранного інтерфейсу. Це дозволить користувачам бачити різний контент під час розмови: погоду, карти, посилання та інші візуальні елементи, які раніше були недоступні у голосовому режимі”.