EVMbench від OpenAI: тестування вразливостей у смартконтрактах

OpenAI запустила платформу EVMbench, яка дозволяє оцінювати ефективність штучного інтелекту у виявленні вразливостей у смартконтрактах екосистеми Ethereum. Платформа створена у співпраці з інвестиційною компанією Paradigm і фірмою з безпеки OtterSec.

Про це розповідає ProIT

Особливості нового бенчмарку EVMbench

Бенчмарк EVMbench базується на 120 унікальних вразливостях, які були зібрані зі 40 аудитів смартконтрактів. Значна частина цих вразливостей була виявлена під час конкурсів із відкритим вихідним кодом, що свідчить про їхню реальну важливість для індустрії криптовалют.

У тестах найкращий результат продемонструвала модель Claude Opus 4.6, яка змогла отримати «винагороду за виявлення» на суму $37 824. Це свідчить про високу ефективність сучасних ШІ-рішень у пошуку та аналізі критичних недоліків у цифрових контрактах.

Порівняння ШІ-моделей за виявленням вразливостей у смартконтрактах Ethereum. Дані: OpenAI.

Важливість вимірювання продуктивності ШІ в захисті криптоактивів

У компанії OpenAI підкреслили, що із зростанням використання штучного інтелекту в роботі зі смартконтрактами виникає потреба чітко оцінювати продуктивність таких систем у середовищах, де на кону стоять значні фінансові ресурси.

«Смартконтракти регулярно забезпечують безпеку криптоактивів із відкритим вихідним кодом на суму понад $100 млрд. У міру того як ШІ-агенти вдосконалюються в читанні, написанні та виконанні коду, стає дедалі важливішим вимірювати їхні можливості в економічно значущих середовищах», — заявили в компанії.

OpenAI наголошує на необхідності впровадження систем штучного інтелекту для підвищення безпеки та аудиту смартконтрактів, а також для активної протидії злочинним діям у криптовалютній індустрії. Розробники бенчмарку переконані, що можливості ШІ необхідно використовувати не лише для розвитку інновацій, а й для захисту цифрових активів від зловмисників.

Крім того, компанія прогнозує подальше зростання платежів у стейблкоїнах, які здійснюватимуться саме агентами, що додатково посилює потребу в надійних системах безпеки.

Запуск EVMbench відбувся на тлі збільшення втрат у криптоіндустрії: лише у 2025 році зловмисники викрали криптовалюту на $4 млрд, що значно перевищує показник попереднього року. У OpenAI очікують, що новий стандарт допоможе ефективніше відстежувати прогрес ШІ у виявленні та усуненні вразливостей у масштабах усієї галузі.

Раніше повідомлялося, що згенерований Claude код спричинив злам протоколу Moonwell із втратою майже $2 млн.