Сектор голосових технологій на базі штучного інтелекту переживає період стрімкого розвитку, особливо в сегменті клієнтської підтримки та сервісу. Проте створити рішення, яке звучить природно та забезпечує мінімальні затримки у відповідях, значно складніше для ринків Африки та Близького Сходу, де більшість гравців досі не пропонують локалізованих продуктів.
Про це розповідає ProIT
Інноваційний підхід до локальних ринків
Стартап AethexAI, заснований у 2025 році Маріамою Діалло та Айолу Одемуйвою, вирішив змінити ситуацію. Компанія залучила $3 млн попереднього фінансування від інвесторів, серед яких 4DX Ventures, Enza Capital, Dorm Room Fund, Mojo Ventures і Stanford GSB 26 Fund, а також окремі бізнес-ангели — викладачі Стенфорду, топ-менеджери телеком-компаній та дослідники зі сфери ШІ.
На відміну від конкурентів, які використовують готові інструменти оркестрації (наприклад, Vapi чи LiveKit), команда AethexAI розробила власну модель і програмний шар для роботи з локалізованими англійською, французькою та арабською мовами. Це рішення стало відповіддю на технічні виклики регіону, де затримки та нестабільність голосових дзвінків створюють серйозні перепони для автоматизації обслуговування.
Технологічні рішення та масштабування
“The latency and jitter that we saw on automated calls in this region were outrageous. If we had become orchestrators, we might have had to use large models that were hosted outside the region, resulting in higher latency. We realized that in order for this to work, we have to use very small models and cut latency at every step,” Odemuyiwa told TechCrunch about the decision to build the company’s own models and orchestration layer.
Для навчання власних моделей стартап використав анонімізовані записи з кол-центрів-партнерів, а також організував збір аудіо з радіостанцій по всій Африці. Для розмітки даних компанія залучила студентів університетів, які допомагають із транскрипціями та правильною вимовою локальних імен. Завдяки цьому AethexAI наразі обробляє понад 17 000 дзвінків щодня.
Платформа вже доступна для корпоративних клієнтів, які можуть скористатися демо, підключити API та SDK для інтеграції технології у власні процеси. Стартап також активно інвестує у навчання клієнтів та проводить практичні воркшопи для пошуку найефективніших сценаріїв автоматизації.
Основна частина запитів нині стосується дзвінків для стягнення заборгованостей, активації клієнтів та процедур ідентифікації (KYC), що широко використовуються у банківському та телеком-секторах. Компанія розвиває партнерства з місцевими операторами зв’язку та залучає інженерів на контрактах для адаптації рішень до особливостей різних ринків. AethexAI наголошує: універсальні plug-and-play рішення у цьому випадку не працюють.
Водночас, ринки Африки та Близького Сходу мають свої унікальні особливості, які відрізняють їх від західних. Співзасновник та керуючий партнер 4DX Ventures Волтер Баду підкреслює, що тут обсяг оброблених дзвінків у середньому втричі більший, а голосові комунікації залишаються основним каналом взаємодії з клієнтами. Стандартизація на рівні англійської мови та потужної GPU-інфраструктури, характерна для західних компаній, не дозволяє швидко впровадити подібні рішення без урахування місцевої специфіки.
На тлі експансії великих гравців, таких як ElevenLabs, Deepgram, Sierra та Cognigy, AethexAI робить ставку на вузькоспеціалізовані моделі, локальні партнерства та гнучку інфраструктуру, щоб заповнити прогалини, які залишаються поза увагою глобальних корпорацій.