Стиснені AI-моделі від Multiverse Computing для бізнесу

Іспанський стартап Multiverse Computing виводить на ринок власні стиснені моделі штучного інтелекту, які здатні працювати безпосередньо на пристроях користувачів, обходячись без дата-центрів чи хмарних сервісів. Це дозволяє уникнути ризиків, пов’язаних із зовнішньою інфраструктурою, та підвищити рівень конфіденційності даних.

Про це розповідає ProIT

Нові можливості для мобільних пристроїв та бізнесу

Останнім часом у світі AI спостерігається тенденція до розвитку компактних моделей, які можна запускати локально. Multiverse Computing вже представила додаток CompactifAI — чат-бот, який працює за принципом ChatGPT, але здатний функціонувати офлайн. Серцем додатку стала модель Gilda, настільки компактна, що її можна запускати на сучасних смартфонах і комп’ютерах без підключення до інтернету. Проте для коректної роботи пристрій має мати достатньо оперативної пам’яті та місця для зберігання даних. Якщо ресурси пристрою недостатні — наприклад, у випадку старіших моделей iPhone — обробка автоматично перемикається на хмарну версію через API. За цей процес відповідає система Ash Nazg, назва якої відсилає до легендарного напису з «Володаря перснів». Однак при переході на хмару головна перевага — локальна обробка даних — втрачається.

Попри інноваційність, CompactifAI поки не став масовим продуктом: за останній місяць його завантажили менше 5 тисяч разів. Основний акцент компанія робить на корпоративних клієнтах. З березня 2026 року Multiverse відкриває самообслуговуючий портал API, що надає бізнесу та розробникам прямий доступ до стиснених моделей, минаючи сторонні маркетплейси.

“The CompactifAI API portal 1773907824 gives developers direct access to compressed models with the transparency and control needed to run them in production,” CEO Enrique Lizaso said in a statement.

Стиснені моделі: ефективність, прозорість та економія

Серед ключових можливостей нового API — моніторинг використання в реальному часі, що особливо важливо для бізнесу. Менші моделі AI приваблюють компанії не лише економією обчислювальних ресурсів, а й зростаючою функціональністю. Наприклад, французька компанія Mistral нещодавно оновила свою лінійку компактних моделей, а система Forge дозволяє створювати кастомізовані рішення під конкретні бізнес-завдання.

Multiverse також демонструє прогрес у наближенні стиснених моделей до можливостей LLM. Їхня нова розробка — HyperNova 60B 2602 на базі відкритого коду gpt-oss-120b — забезпечує швидші відповіді та менші витрати порівняно з оригіналом. Це особливо актуально для автоматизованого програмування, де AI виконує складні багатокрокові завдання без участі людини.

Завдання створити повноцінні AI-моделі, придатні для роботи на мобільних пристроях, залишається складним. Наприклад, Apple Intelligence поєднує локальні та хмарні обчислення, а CompactifAI може також направляти запити до gpt-oss-120b через API. Однак головна мета — довести, що локальні моделі мають переваги не тільки у вартості, а й у конфіденційності та автономності.

Для спеціалістів у критичних сферах, здатність запускати AI без підключення до хмари відкриває нові можливості щодо захисту даних та стійкості до перебоїв. Особливо це актуально для використання у дронах, супутниках та інших пристроях, де стабільний інтернет-зв’язок не гарантується.

На сьогодні Multiverse Computing обслуговує понад 100 клієнтів по всьому світу, серед яких Bank of Canada, Bosch та Iberdrola. Залучення нових користувачів допоможе компанії отримати додаткове фінансування: після минулорічного раунду на $215 млн, зараз ведуться перемовини про залучення ще €500 млн при оцінці понад €1,5 млрд.