Инновационные модели изоляции голоса от Subtle Computing

Стартап Subtle Computing из Калифорнии предлагает инновационные решения для изоляции голоса, которые позволяют компьютерам четче распознавать человеческую речь даже в очень шумных условиях. Это открывает новые возможности для развития голосовых AI-продуктов и сервисов.

Об этом сообщает ProIT

Персонализированные модели для различных устройств

В современном мире активно растет популярность приложений, использующих голосовой искусственный интеллект, в частности сервисов для стенографирования встреч и голосового ввода. Однако одной из главных проблем таких продуктов является качественная запись речи в местах с фоновым шумом, например, в кафе или офисах.

Чтобы решить эту задачу, команда Subtle Computing разработала комплексную модель изоляции голоса, способную понимать речь даже в сложных акустических условиях. По словам Тайлера Чена, вместо универсального подхода компания обучает индивидуальные модели под акустические характеристики конкретного устройства, а также адаптирует их под голос пользователя.

«Что мы обнаружили, так это то, что когда мы сохраняем акустические характеристики устройства, мы получаем на порядок лучшую производительность, чем универсальные решения. Это также означает, что мы можем предложить персонализированные решения пользователю,» — сказал Чен.

Такой подход позволяет существенно повысить точность распознавания голоса по сравнению со стандартными решениями. Кроме того, это обеспечивает персонализированный опыт для каждого пользователя.

Технологическое партнерство и планы развития

Стартап основали Тайлер Чен, Дэвид Харрисон, Саванна Кофер и Джеки Янг, которые познакомились во время учебы в Стэнфорде. Они начали работу над альтернативными интерфейсами для компьютеров в рамках курса Lean Launchpad под руководством Стива Бланка.

Subtle Computing сообщает, что их модель изоляции голоса может работать на некоторых устройствах без подключения к облаку, занимая всего несколько мегабайт и обеспечивая задержку в 100 миллисекунд. Также компания имеет отдельную модель для транскрибирования голоса в текст, которая, благодаря улучшенной изоляции, обеспечивает более высокую точность распознавания.

Компания была выбрана Qualcomm для участия в программе Voice and Music Extension, что означает совместимость технологии Subtle Computing с чипами Qualcomm и дальнейшую интеграцию в устройства производителей электроники.

Стартап привлек 6 миллионов долларов начальных инвестиций под руководством Entrada Ventures, а также с участием Amplify Partners, Abstract Ventures и ряда ангельских инвесторов, среди которых основатели Twitter, Pinterest и Perplexity. По словам Карен Ротер Дэвис, управляющей партнерки Entrada Ventures, изоляция голоса — перспективное направление, которое позволяет улучшить взаимодействие с голосовыми интерфейсами даже в сложных условиях и сделать его более надежным и приятным.

Subtle Computing уже заключила партнерства с одним из брендов потребительской электроники и автопроизводителем (названия компаний не разглашаются) для внедрения своих решений. Однако стартап стремится не только поставлять модели другим компаниям, но и представить собственный потребительский продукт, который будет сочетать аппаратное и программное обеспечение. Анонс этого продукта запланирован на следующий год.