Платформа для онлайн-запису подкастів Riverside представила власний підсумок року для своїх користувачів — функцію «Rewind», що нагадує популярний Spotify Wrapped. Цей інструмент використовує штучний інтелект для створення трьох персоналізованих відеороликів, які відображають моменти зі записів подкастерів.
Про це розповідає ProIT
Як працює Riverside Rewind
Замість звичних статистичних даних, таких як загальна кількість випусків чи хвилин запису, Riverside формує 15-секундний відеоколаж з фрагментами сміху — швидкою зміною моментів, коли ведучі подкасту сміються один з одного. Другий відеоролик являє собою монтаж фрази «ем», яку ведучі вимовляють у різних епізодах.
Далі штучний інтелект аналізує автоматичні транскрипти записів, щоб визначити слово, що найчастіше зустрічається у промові кожного подкастера. Розробники зазначають, що при цьому ігноруються службові слова на кшталт «і» чи «те». Так, у подкасті про інтернет-культуру найчастіше звучало слово «book» — ймовірно, через випуски «book club» та активне просування нової книги одного з ведучих.
Інший подкаст із мережі — Spirits — частіше за все згадував ім’я «Amanda». Це пояснюється тим, що у шоу є ведуча з таким іменем.
AI у подкастингу: нові можливості чи ризики?
У корпоративному чаті Slack учасники мережі обмінювалися відео з Rewind. Дивитися, як люди постійно повторюють «ем», дійсно кумедно, однак, як зазначають подкастери, такі інструменти не завжди мають практичну цінність. Відео може розважити, але не несе змістовного навантаження.
“AI дозволяє автоматизувати частину рутинних завдань — наприклад, видаляти слова-паразити або паузи у записах. Проте сам процес створення подкасту не зводиться лише до механічної роботи”.
Зростання кількості AI-інструментів у сфері подкастингу відбувається на тлі того, що багато креаторів втрачають можливості для створення, редагування та продюсування нових програм через автоматизацію. Хоча штучний інтелект значно спрощує створення транскриптів для забезпечення доступності, він не здатен приймати редакційні рішення для побудови якісної розповіді. Також AI не може визначити, коли розмова у подкасті дійсно цікава, а коли — зайва.
Попри поширення персоналізованих AI-інструментів для роботи з аудіо, останнім часом вони демонструють і суттєві недоліки. Наприклад, нещодавно The Washington Post почала тестувати автоматично згенеровані штучним інтелектом новинні подкасти. Втім, ці випуски містили вигадані цитати й фактичні помилки, що є серйозною загрозою для медіа. Внутрішнє тестування показало, що 68–84% таких подкастів не відповідали стандартам видання.
Ситуація свідчить про те, що великі мовні моделі (LLM) не здатні розрізняти правду і вигадку, оскільки їхнє завдання — формувати найбільш імовірний, а не обов’язково достовірний результат.
Riverside Rewind — цікавий приклад застосування AI для підбиття підсумків року у подкастингу, але він став ще одним прикладом проникнення штучного інтелекту у цю індустрію. У період технологічного «AI-буму» важливо чітко розмежовувати, коли штучний інтелект справді покращує творчий процес, а коли перетворюється на інструмент створення зайвого контенту без цінності.