Обновление Siri: гибридная модель с Google Gemini и AI

Apple готовится к значительной модернизации голосового ассистента Siri, рассматривая переход к гибридной модели, где будет сочетаться локальная обработка данных с мощностью облачных технологий и интеграцией сторонних систем искусственного интеллекта, таких как Google Gemini.

Об этом сообщает ProIT

Ограничения локального ИИ и технологический разрыв

Несмотря на то, что Apple продолжает инвестировать в собственные чипы с Neural Engine, современные языковые модели искусственного интеллекта слишком объемные для полноценной работы непосредственно на смартфонах. Даже оптимизированные для мобильных устройств модели имеют ограниченный набор параметров, в то время как облачные системы могут обеспечивать в тысячи раз большую производительность и сложность. Это создает значительный технологический разрыв: локальные ИИ-решения обеспечивают скорость и приватность, но уступают в функциональности большим облачным моделям.

Интеграция Google Gemini и использование облачных мощностей

Будущие обновления Siri могут предусматривать частичное использование моделей Google Gemini, включая не только прямое подключение к облачным сервисам, но и применение «дистилляции» — когда большие облачные модели обучают компактные локальные версии. Несмотря на такие оптимизации, сложные запросы все же будут обрабатываться в облаке, а сама Siri может стать гибридной системой, которая динамически распределяет задачи между устройством пользователя и удаленным сервером.

«Даже несмотря на традиционный акцент Apple на конфиденциальности и локальной обработке, сложные запросы все чаще будут требовать внешних серверов».

Кроме собственной инфраструктуры Private Cloud Compute, Apple рассматривает варианты сотрудничества со сторонними поставщиками, такими как Nvidia, чьи технологии confidential computing позволяют обрабатывать данные в зашифрованном виде даже во время работы на сервере. Это сочетает вычислительные преимущества облачных решений с высоким уровнем защиты информации.

Причиной такого перехода является масштаб современных моделей искусственного интеллекта: даже самые мощные мобильные процессоры не способны запускать полноценные модели уровня Gemini из-за ограничений памяти и энергопотребления. Локальный ИИ останется для базовых задач, а сложные сценарии — анализ документов, многошаговая обработка или генерация контента — будут передаваться в облако.

В случае внедрения такой гибридной архитектуры Siri автоматически определит, обрабатывать ли запрос на устройстве или направлять его на серверы. Для пользователей это означает возможность получать расширенные возможности ассистента, хотя в случае сложных запросов могут возникать незначительные задержки из-за обращения к облачной инфраструктуре.