Випробувати HierSpeech++ можна на Hugging Face або завантажити локально з GitHub.
Для генерації аудіо просто завантажте зразок голосу та текст, який необхідно озвучити.
На цей час інструмент HierSpeech++ доступний лише англійською, однак багатомовну модель планують запустити вже «найближчим часом».
Раніше ШІ-стартап ElevenLabs запустив власну послугу клонування голосу, що також дозволяє користувачам генерувати аудіо за допомогою нейромереж на основі завантажених зразків тривалістю кілька хвилин. (Компанія на початку року виклала свою технологію у відкритому доступі, чим одразу скористалися інтернет-троллі — в соцмережах тоді поширювали фейкові голоси знаменитостей, що говорили образливі речі, оголошували війни чи цитували Гітлера).