Компанія Google анонсувала запуск нової моделі штучного інтелекту Gemini 2.5, яка демонструє вражаючі результати в тестах на міркування. Ця нова технологія стала відповіддю на зростаючу конкуренцію в сфері штучного інтелекту, особливо після виходу першої моделі міркування від OpenAI у вересні 2024 року.
Про це розповідає ProIT
Відзначимо, що в цій гонці беруть участь й інші провідні компанії, такі як Anthropic, DeepSeek та xAI. Всі вони намагаються перевершити досягнення OpenAI, застосовуючи додаткові обчислювальні потужності та час для перевірки фактів, а також запускаючи процес міркування перед наданням відповідей.
Результати тестування Gemini 2.5
Gemini 2.5 Pro продемонструвала вражаючі результати в тестах Aider Polyglot (68,6%) та SWE-bench Verified (63,8%), перевершивши аналоги від OpenAI та DeepSeek. Проте, за деякими показниками все ж відстала від моделі Anthropic. У мультимодальному тесті, що складається з тисяч запитів з математики, гуманітарних та природничих наук, Gemini 2.5 Pro набрала 18,8%, що також є кращим результатом, ніж у більшості її конкурентів.
Безкоштовний доступ до нових можливостей
У демонстраційному відео показано, як Gemini 2.5 Pro застосовує свої можливості для програмування відеоігор на основі лише однієї підказки. Ця новинка має контекстне вікно обсягом 1 мільйон токенів, що дозволяє обробляти приблизно 750 000 слів за один раз — це більше, ніж вся серія книг «Володар перснів». Заплановано можливість подвоєння цього обсягу в найближчому майбутньому.
Мультимодальна модель Gemini 2.5 Pro Experimental доступна безкоштовно у Google AI Studio, а також у застосунку Gemini для передплатників тарифу Advanced за $20 на місяць.
«OpenAI у біді»: DeepSeek V3-0324 отримала покращені можливості програмування та математики