Mistral представила Voxtral — першу відкриту аудіо AI-модель для бізнесу

|
Mistral представила Voxtral — першу відкриту аудіо AI-модель для бізнесу

Французький стартап у сфері штучного інтелекту Mistral оголосив про випуск Voxtral — своєї першої відкритої аудіомоделі, яка створена для бізнесу та має на меті стати альтернативою закритим корпоративним рішенням на ринку.

Про це розповідає ProIT

Voxtral: новий етап у розвитку розпізнавання мови

Mistral позиціонує Voxtral як першу відкриту аудіомодель, здатну забезпечити «дійсно корисний мовний інтелект у реальних умовах». Це дозволяє розробникам обирати не між дешевими, але неточними відкритими рішеннями та якісними, але дорогими й закритими системами, а отримати доступний інструмент із високою точністю роботи. За словами компанії, Voxtral коштує менше половини ціни порівняних пропозицій на ринку.

«Більше не потрібно обирати між дешевими відкритими системами, що погано розпізнають мовлення, та закритими платформами з високою вартістю та обмеженим контролем над розгортанням».

Технічні можливості та варіанти Voxtral

Voxtral здатен транскрибувати до 30 хвилин звуку, а завдяки LLM-ядру Mistral Small 3.1 може розуміти до 40 хвилин аудіо. Це дозволяє ставити питання щодо змісту запису, генерувати його короткі підсумки та миттєво виконувати голосові команди — наприклад, викликати API або запускати певні функції. Модель підтримує багатомовну роботу: розпізнає та розуміє англійську, іспанську, французьку, португальську, гінді, німецьку, нідерландську й італійську мови.

Mistral пропонує дві версії своєї моделі розуміння мовлення. Voxtral Small із 24 мільярдами параметрів орієнтована на промислове використання і конкурує з такими лідерами ринку, як ElevenLabs Scribe, GPT-4o-mini та Gemini 2.5 Flash. Voxtral Mini має 3 мільярди параметрів, оптимізована для локального та периферійного розгортання. Також існує спрощена й наддешевша версія Voxtral Mini Transcribe, створена спеціально для транскрипції, яка, за запевненнями компанії, перевершує OpenAI Whisper за менш ніж половину його вартості.

Спробувати Voxtral можна безкоштовно — через API на платформі Hugging Face або у чат-боті Mistral Le Chat. Початкова вартість інтеграції API складає $0,001 за хвилину.

Випуск Voxtral відбувся через місяць після запуску Magistral — першої лінійки моделей Mistral для поетапного розв’язання завдань, що підвищує надійність рішень.

Mistral — один із лідерів AI-індустрії Європи — відома своєю активною підтримкою відкритих моделей штучного інтелекту. На початку липня стало відомо, що компанія веде переговори про залучення до $1 мільярда інвестицій, зокрема від фонду MGX з Абу-Дабі.