Французский стартап Mistral анонсировал запуск новой модели искусственного интеллекта для программирования под названием Devstral, которая была разработана в партнерстве с компанией All Hands AI. Эта модель, по заявлению компании, превосходит все другие открытые модели по результатам тестирования SWE-Bench Verified.
Об этом сообщает ProIT
В Mistral подчеркивают, что хотя типичные большие языковые модели (LLM) могут эффективно выполнять отдельные задачи программирования, они сталкиваются с трудностями при решении реальных инженерных проблем. Это касается вопросов, которые требуют глубокого понимания обширной кодовой базы, выявления связей между различными компонентами и поиска скрытых ошибок в сложных функциях.
Особенности Devstral
«Devstral создан для решения именно таких проблем. Модель обучена работать с реальными задачами из GitHub. Она функционирует через агентные интерфейсы, такие как OpenHands или SWE-Agent, которые обеспечивают связь между моделью и тестами», – говорится в блоге стартапа.
Devstral демонстрирует впечатляющий результат, достигая 46,8% на SWE-Bench Verified, что на 6% выше по сравнению с предыдущими открытыми моделями SoTA (state-of-the-art).
Доступность и лицензирование
Новая модель является достаточно легкой и может работать на одной видеокарте RTX 4090 или Mac с 32 ГБ оперативной памяти, что позволяет запускать ее непосредственно на устройстве. Платформы для кодирования, такие как OpenHands, обеспечивают возможность модели взаимодействовать с локальными кодовыми базами и быстро находить решения для возникающих проблем.
Devstral будет выпущен бесплатно под лицензией Apache 2.0. Модель также доступна через API под названием devstral-small-2505 по цене, аналогичной Mistral Small 3.1:
- $0,1 за миллион входных токенов,
- $0,3 за миллион выходных токенов.
Кроме того, Devstral можно загрузить на платформах, таких как HuggingFace, Ollama, Kaggle, Unsloth и LM Studio. В Mistral отмечают, что Devstral является предварительным исследовательским релизом, а в настоящее время компания работает над созданием более мощной агентной модели для программирования, которая должна появиться в течение нескольких недель.
«Devstral создан для решения именно таких проблем. Модель обучена решать реальные проблемы из GitHub».
Интересно, что французский стартап уже имеет другую модель искусственного интеллекта для программирования под названием Codestral, но она имеет лицензию, ограничивающую использование разработчиками в коммерческих целях.