Французький стартап Mistral анонсував запуск нової моделі штучного інтелекту для програмування під назвою Devstral, яка була розроблена у партнерстві з компанією All Hands AI. Ця модель, за заявою компанії, перевершує всі інші відкриті моделі за результатами тестування SWE-Bench Verified.
Про це розповідає ProIT
У Mistral підкреслюють, що хоча типові великі мовні моделі (LLM) можуть ефективно виконувати окремі завдання програмування, вони стикаються з труднощами при вирішенні реальних інженерних проблем. Це стосується питань, які потребують глибокого розуміння обширної кодової бази, виявлення зв’язків між різними компонентами і пошуку прихованих помилок у складних функціях.
Особливості Devstral
«Devstral створено для вирішення саме таких проблем. Модель навчена працювати з реальними задачами з GitHub. Вона функціонує через агентні інтерфейси, такі як OpenHands або SWE-Agent, які забезпечують зв’язок між моделлю та тестами», – йдеться у блозі стартапу.
Devstral демонструє вражаючий результат, досягаючи 46,8% на SWE-Bench Verified, що є на 6% вище за попередні відкриті моделі SoTA (state-of-the-art).
Доступність та ліцензування
Нова модель є досить легкою і може працювати на одній відеокарті RTX 4090 або Mac з 32 ГБ оперативної пам’яті, що дозволяє її запускати безпосередньо на пристрої. Платформи для кодування, такі як OpenHands, забезпечують можливість моделі взаємодіяти з локальними кодовими базами і швидко знаходити рішення для виникаючих проблем.
Devstral буде випущено безкоштовно під ліцензією Apache 2.0. Модель також доступна через API під назвою devstral-small-2505 за ціною, аналогічною до Mistral Small 3.1:
- $0,1 за мільйон вхідних токенів,
- $0,3 за мільйон вихідних токенів.
Крім того, Devstral можна завантажити на платформах, таких як HuggingFace, Ollama, Kaggle, Unsloth та LM Studio. У Mistral зазначають, що Devstral є попереднім дослідницьким релізом, а наразі компанія працює над створенням більш потужної агентної моделі для програмування, яка повинна з’явитися протягом кількох тижнів.
«Devstral створено для вирішення саме таких проблем. Модель навчена вирішувати реальні проблеми з GitHub».
Цікаво, що французький стартап вже має іншу модель штучного інтелекту для програмування під назвою Codestral, але вона має ліцензію, що обмежує використання розробниками в комерційних цілях.