Компанія Anthropic випустила нову версію свого флагманського штучного інтелекту Opus 4.5, яка стала завершальною моделлю в серії 4.5 після релізів Sonnet 4.5 у вересні та Haiku 4.5 у жовтні.
Про це розповідає ProIT
Нові можливості та продуктивність Opus 4.5
Opus 4.5 демонструє найвищі результати на провідних тестах, зокрема на SWE-Bench і Terminal-bench для програмування, tau2-bench і MCP Atlas для використання інструментів, а також ARC-AGI 2 і GPQA Diamond для вирішення загальних завдань. Модель стала першою, яка перевищила позначку у 80% на SWE-Bench verified — престижному тесті для оцінювання навичок кодування.
Особливу увагу Anthropic приділила можливостям Opus 4.5 у роботі з комп’ютерними програмами та електронними таблицями. Разом із новою моделлю компанія відкрила ширший доступ до продуктів Claude для Chrome та Claude для Excel, які раніше перебували на стадії пілотного тестування. Тепер розширення для Chrome стане доступним для всіх користувачів тарифу Max, а інтеграція з Excel — для користувачів Max, Team і Enterprise.
Покращена пам’ять і “нескінченний чат”
Opus 4.5 отримала значно покращене управління пам’яттю для довготривалих операцій із великими обсягами даних. Це стало можливим завдяки масштабним змінам у підходах до зберігання та використання контексту моделі.
"There are improvements we made on general long context quality in training with Opus 4.5, but context windows are not going to be sufficient by themselves," Dianne Na Penn, Anthropic’s head of product management for research, told TechCrunch. "Knowing the right details to remember is really important in complement to just having a longer context window".
Завдяки цим оновленням з’явилася бажана багатьма користувачами функція “нескінченного чату” для платних підписників Claude. Вона дозволяє спілкуватися з ботом без перерв навіть після досягнення ліміту контексту: модель стискає історію діалогу без попередження користувача.
Багато оновлень Opus 4.5 орієнтовані на агентні сценарії використання, де Opus виступає головним агентом, керуючи групою підлеглих агентів на базі Haiku. Для виконання таких завдань потрібна потужна робоча пам’ять — саме тут покращення Opus 4.5 дають значний ефект.
За словами Діанни На Пенн, фундаментальні зміни у пам’яті особливо важливі, адже Claude повинен мати змогу досліджувати великі кодові бази, працювати з масштабними документами і своєчасно повертатись до попередніх етапів аналізу при необхідності.
Opus 4.5 конкуруватиме з іншими провідними моделями останнього покоління, зокрема GPT 5.1 від OpenAI (випущена 12 листопада) та Gemini 3 від Google (випущена 18 листопада).