Microsoft представила три нові AI-моделі для тексту, голосу та зображень

|
Microsoft представила три нові AI-моделі для тексту, голосу та зображень

Microsoft AI, дослідницький підрозділ технологічного гіганта, оголосив про запуск трьох нових базових моделей штучного інтелекту, призначених для генерації тексту, голосу та зображень. Цей крок підкреслює прагнення Microsoft розвивати власний стек мультимодальних AI-рішень і конкурувати з провідними лабораторіями штучного інтелекту, залишаючись при цьому партнером OpenAI.

Про це розповідає ProIT

Можливості нових AI-моделей Microsoft

Серед презентованих моделей — MAI-Transcribe-1, що дозволяє швидко транскрибувати мовлення 25 мовами світу у текст. За даними компанії, цей інструмент працює у 2,5 рази швидше, ніж нинішня Azure Fast. Модель MAI-Voice-1 створює аудіо: вона здатна згенерувати 60 секунд звуку лише за одну секунду, а також дає змогу створити унікальний голос користувача. MAI-Image-2 — це відеогенеруюча модель нового покоління.

MAI-Image-2 спочатку була презентована на платформі MAI Playground — новому середовищі для тестування великих мовних моделей — ще 19 березня. Тепер усі три моделі доступні на майданчику Microsoft Foundry, а інструменти для транскрипції та голосу — і в MAI Playground.

Стратегія розвитку та цінова політика

Розробкою моделей займалася команда MAI Superintelligence під керівництвом Мустафи Сулеймана, генерального директора Microsoft AI, яка була створена у листопаді 2025 року.

“At Microsoft AI, we’re building Humanist AI. We have a distinct view when creating our AI models — putting humans at the center, optimizing for how people actually communicate, training for practical use,” Suleyman wrote in the blog post. “You’ll see more models from us soon in Foundry and directly in Microsoft products and experiences.”

На тлі зростаючої конкуренції на ринку великих мовних моделей Microsoft робить акцент на доступнішій ціні своїх рішень порівняно з продуктами Google та OpenAI. MAI-Transcribe-1 коштує від $0,36 за годину роботи, MAI-Voice-1 — від $22 за 1 мільйон символів, а MAI-Image-2 — від $5 за 1 мільйон токенів на текстовий ввід і $33 за 1 мільйон токенів на вивід зображень.

Попри розвиток власних AI-технологій, Сулейман підтвердив збереження довгострокового партнерства Microsoft з OpenAI. Водночас нещодавня переукладена угода між компаніями дала Microsoft більше можливостей для незалежних досліджень у сфері штучного інтелекту. За останні роки корпорація інвестувала понад $13 мільярдів у AI-дослідження. Моделі Microsoft інтегруються у продукти компанії в рамках багаторічного співробітництва, а у сфері процесорів Microsoft також використовує як власні розробки, так і сторонні рішення.