Mistral представила Voxtral — первая открытая аудио AI-модель для бизнеса

|
Mistral представила Voxtral — первая открытая аудио AI-модель для бизнеса

Французский стартап в сфере искусственного интеллекта Mistral объявил о выпуске Voxtral — своей первой открытой аудиомодели, которая создана для бизнеса и имеет целью стать альтернативой закрытым корпоративным решениям на рынке.

Об этом сообщает ProIT

Voxtral: новый этап в развитии распознавания речи

Mistral позиционирует Voxtral как первую открытую аудиомодель, способную обеспечить «действительно полезный языковой интеллект в реальных условиях». Это позволяет разработчикам выбирать не между дешевыми, но неточными открытыми решениями и качественными, но дорогими и закрытыми системами, а получить доступный инструмент с высокой точностью работы. По словам компании, Voxtral стоит меньше половины цены сопоставимых предложений на рынке.

«Больше не нужно выбирать между дешевыми открытыми системами, которые плохо распознают речь, и закрытыми платформами с высокой стоимостью и ограниченным контролем над развертыванием».

Технические возможности и варианты Voxtral

Voxtral способен транскрибировать до 30 минут звука, а благодаря LLM-ядру Mistral Small 3.1 может понимать до 40 минут аудио. Это позволяет задавать вопросы о содержании записи, генерировать его краткие резюме и мгновенно выполнять голосовые команды — например, вызывать API или запускать определенные функции. Модель поддерживает многозначную работу: распознает и понимает английский, испанский, французский, португальский, хинди, немецкий, нидерландский и итальянский языки.

Mistral предлагает две версии своей модели понимания речи. Voxtral Small с 24 миллиардами параметров ориентирована на промышленное использование и конкурирует с такими лидерами рынка, как ElevenLabs Scribe, GPT-4o-mini и Gemini 2.5 Flash. Voxtral Mini имеет 3 миллиарда параметров, оптимизирована для локального и периферийного развертывания. Также существует упрощенная и сверхдешевая версия Voxtral Mini Transcribe, созданная специально для транскрипции, которая, по заверениям компании, превосходит OpenAI Whisper за менее чем половину его стоимости.

Попробовать Voxtral можно бесплатно — через API на платформе Hugging Face или в чат-боте Mistral Le Chat. Начальная стоимость интеграции API составляет $0,001 за минуту.

Выпуск Voxtral состоялся через месяц после запуска Magistral — первой линейки моделей Mistral для поэтапного решения задач, что повышает надежность решений.

Mistral — один из лидеров AI-индустрии Европы — известна своей активной поддержкой открытых моделей искусственного интеллекта. В начале июля стало известно, что компания ведет переговоры о привлечении до $1 миллиарда инвестиций, в том числе от фонда MGX из Абу-Даби.