Компанія Google презентувала оновлену версію своєї флагманської моделі штучного інтелекту — Gemini 3.1 Pro. Нова модель вже доступна для розробників та користувачів у режимі попереднього перегляду та орієнтована на розв’язання складних завдань і поглиблене міркування.
Про це розповідає ProIT
Покращення продуктивності та результати тестів
За словами Google, Gemini 3.1 Pro демонструє відчутно кращі показники, ніж попередні версії. Зокрема, в тесті Humanity’s Last Exam, який оцінює глибокі знання у спеціалізованих сферах, нова модель досягла рекордних 44,4%, тоді як Gemini 3 Pro мала 37,5%, а GPT 5.2 від OpenAI — 34,5%.
Окрім цього, Google підкреслює значний прогрес у тесті ARC-AGI-2, що включає логічні завдання, які неможливо прямо навчити штучному інтелекту. Gemini 3.1 Pro змогла набрати 77,1%, суттєво обігнавши попередню версію Gemini 3, яка показала лише 31,1%.
«Google стверджує, що 3.1 Pro готова до “ваших найскладніших завдань”.»
Особливості, доступність і ціни
Попри значні покращення, у рейтингу Arena leaderboard (LM Arena) Gemini 3.1 Pro поступилася конкурентам у текстових і кодових завданнях. Claude Opus 4.6 у тексті випереджає Gemini на чотири бали, а Opus 4.6, Opus 4.5 і GPT 5.2 High — у категорії коду. Варто зазначити, що цей рейтинг базується на уподобаннях користувачів і часто нагороджує найбільш переконливі, а не завжди правильні відповіді.
Оновлена модель також демонструє вдосконалення у генерації графіки та симуляцій. Приклади SVG, які представила Google, є більш витонченими та деталізованими. Для розробників, що займаються створенням агентських робочих процесів, Gemini 3.1 Pro майже подвоїла свої результати в бенчмарку APEX-Agents.
Gemini 3.1 Pro вже доступна у AI Studio та IDE Antigravity в режимі попереднього перегляду, а корпоративні користувачі знайдуть модель у Vertex AI і Gemini Enterprise. Для широкого загалу оновлена модель доступна через застосунок Gemini та NotebookLM. Вартість API для розробників залишилася незмінною — 2 долари за введення та 12 доларів за виведення за мільйон токенів, а контекстне вікно становить 1 мільйон вхідних і 64 тисячі вихідних токенів. Очікується, що найближчим часом буде оновлено й швидшу та дешевшу модель Flash до версії 3.1.
