Mistral презентує Devstral – нову модель штучного інтелекту для програмування

|
Mistral презентує Devstral – нову модель штучного інтелекту для програмування

Французький стартап Mistral анонсував запуск нової моделі штучного інтелекту для програмування під назвою Devstral, яка була розроблена у партнерстві з компанією All Hands AI. Ця модель, за заявою компанії, перевершує всі інші відкриті моделі за результатами тестування SWE-Bench Verified.

Про це розповідає ProIT

У Mistral підкреслюють, що хоча типові великі мовні моделі (LLM) можуть ефективно виконувати окремі завдання програмування, вони стикаються з труднощами при вирішенні реальних інженерних проблем. Це стосується питань, які потребують глибокого розуміння обширної кодової бази, виявлення зв’язків між різними компонентами і пошуку прихованих помилок у складних функціях.

Особливості Devstral

«Devstral створено для вирішення саме таких проблем. Модель навчена працювати з реальними задачами з GitHub. Вона функціонує через агентні інтерфейси, такі як OpenHands або SWE-Agent, які забезпечують зв’язок між моделлю та тестами», – йдеться у блозі стартапу.

Devstral демонструє вражаючий результат, досягаючи 46,8% на SWE-Bench Verified, що є на 6% вище за попередні відкриті моделі SoTA (state-of-the-art).

Доступність та ліцензування

Нова модель є досить легкою і може працювати на одній відеокарті RTX 4090 або Mac з 32 ГБ оперативної пам’яті, що дозволяє її запускати безпосередньо на пристрої. Платформи для кодування, такі як OpenHands, забезпечують можливість моделі взаємодіяти з локальними кодовими базами і швидко знаходити рішення для виникаючих проблем.

Devstral буде випущено безкоштовно під ліцензією Apache 2.0. Модель також доступна через API під назвою devstral-small-2505 за ціною, аналогічною до Mistral Small 3.1:

  • $0,1 за мільйон вхідних токенів,
  • $0,3 за мільйон вихідних токенів.

Крім того, Devstral можна завантажити на платформах, таких як HuggingFace, Ollama, Kaggle, Unsloth та LM Studio. У Mistral зазначають, що Devstral є попереднім дослідницьким релізом, а наразі компанія працює над створенням більш потужної агентної моделі для програмування, яка повинна з’явитися протягом кількох тижнів.

«Devstral створено для вирішення саме таких проблем. Модель навчена вирішувати реальні проблеми з GitHub».

Цікаво, що французький стартап вже має іншу модель штучного інтелекту для програмування під назвою Codestral, але вона має ліцензію, що обмежує використання розробниками в комерційних цілях.