У лютому 2026 року штучний інтелект продемонстрував суттєвий прогрес у виконанні професійних завдань, зокрема у сфері права. Раніше результати тестування ІІ-агентів на платформі Mercor були досить низькими: жодна з провідних лабораторій не подолала позначку в 25%, що давало підстави вважати, що юристи поки що не мають причин для занепокоєння.
Про це розповідає ProIT
Ривок Anthropic Opus 4.6 на новому етапі тестування
Проте ситуація різко змінилася після нещодавнього випуску моделі Anthropic Opus 4.6. Оновлений ІІ у одноразових випробуваннях здобув майже 30% балів, а при повторних спробах показники зросли в середньому до 45%. Це стало значним проривом, враховуючи попередні результати.
Окрім підвищеної продуктивності, Opus 4.6 отримав низку нових інструментів, серед яких – так звані «agent swarms», що дозволяють ІІ-агентам ефективніше розв’язувати багатоступеневі задачі. Саме ці функції, ймовірно, сприяли кращим результатам у складних юридичних сценаріях.
Реакція експертів і майбутні перспективи
Генеральний директор Mercor Брендан Фуді відзначив темпи зростання як безпрецедентні, підкресливши:
“jumping from 18.4% to 29.8% in a few months is insane”.
Цей стрибок свідчить, що розвиток фундаментальних моделей ІІ не сповільнюється, а навпаки – набирає обертів. Попри те, що показник у 30% ще далекий від 100%, і юристи найближчим часом не втратять свої позиції, впевненість у незамінності людини у цій сфері вже не така міцна, як місяць тому.
Такі тенденції свідчать: подальший розвиток ІІ-агентів може суттєво вплинути на юридичний сектор у найближчі роки.