Multiverse Computing презентувала найменші високопродуктивні AI-моделі для пристроїв IoT

|
Multiverse Computing презентувала найменші високопродуктивні AI-моделі для пристроїв IoT

Європейський стартап у сфері штучного інтелекту Multiverse Computing представив дві надзвичайно компактні AI-моделі, які отримали назви на честь розміру мозку курки та мухи. За словами компанії, ці моделі — найменші у світі серед високопродуктивних, здатні виконувати завдання чат-бота, розпізнавання мови та навіть логічного міркування.

Про це розповідає ProIT

Інноваційна технологія стиснення CompactifAI

Головна особливість моделей — їхній мінімальний розмір завдяки унікальному алгоритму стиснення CompactifAI, натхненному квантовими технологіями. Він дозволяє зменшувати вагу моделей без втрати продуктивності. Засновник компанії Роман Орус підкреслив, що це не звичайна технологія стиснення, яку використовують у комп’ютерних науках чи машинному навчанні, а більш тонкий і витончений алгоритм, що походить з квантової фізики.

“Ми можемо настільки сильно стиснути модель, що вона поміститься на пристроях. Ви можете запускати її локально — прямо на вашому iPhone чи Apple Watch”, — зазначив Орус.

Моделі призначені для вбудовування в пристрої Інтернету речей (IoT), а також для роботи на смартфонах, планшетах і персональних комп’ютерах без необхідності підключення до інтернету. Multiverse Computing вже випустила низку стиснутих версій відкритих моделей, зокрема популярних Llama 4 Scout, Mistral Small 3.1, а нещодавно — і OpenAI. В асортименті також є стиснута версія великої моделі DeepSeek R1 Slim.

Моделі SuperFly та ChickBrain: особливості та сфери застосування

Найменша новинка — модель SuperFly, яка є стиснутою версією SmolLM2 135 від Hugging Face. Якщо оригінал має 135 млн параметрів, то SuperFly — лише 94 млн, що співвідносять із розміром мозку мухи. Ця модель створена для роботи з обмеженими даними пристрою і може бути інтегрована у побутову техніку, наприклад, для керування пральною машиною голосовими командами або вирішення типових питань користувачів. Для управління достатньо мінімальних обчислювальних ресурсів, зокрема Arduino.

Друга модель — ChickBrain — містить 3,2 млрд параметрів і вирізняється потужнішими можливостями, зокрема навичками логічного мислення. Вона є стиснутою версією Llama 3.1 8B від Meta і може запускатися навіть на MacBook без підключення до мережі. За внутрішніми тестами Multiverse, ChickBrain навіть трохи перевищує оригінальну модель за результатами стандартних бенчмарків: MMLU-Pro (мовні навички), Math 500 і GSM8K (математичні задачі), GPQA Diamond (загальні знання).

Зазначається, що Multiverse не ставить за мету перевершити найпотужніші сучасні AI-моделі. Основний акцент — на забезпеченні максимальної ефективності при мінімальному обсязі ресурсів, що відкриває нові можливості для розміщення AI безпосередньо на пристроях користувачів.

Компанія вже веде переговори з провідними виробниками пристроїв та електроніки, серед яких Apple, Samsung, Sony та HP. Останній раунд інвестицій у розмірі 189 млн євро, проведений у червні, очолив фонд Bullhound Capital, а до нього долучилися HP Tech Ventures і Toshiba. Загалом з моменту заснування у 2019 році Multiverse залучила близько 250 млн доларів інвестицій.

Стартап також пропонує технологію стиснення для інших завдань машинного навчання, як-от розпізнавання зображень, і вже співпрацює з компаніями BASF, Ally, Moody’s, Bosch та іншими. Окрім прямих продажів виробникам, Multiverse надає доступ до своїх стиснутих моделей через API на AWS, що дозволяє розробникам використовувати їх за нижчими тарифами, ніж у конкурентів.