Anthropic навчає ШІ виявляти вразливості смартконтрактів на $4,6 млн

Anthropic навчила ШІ-моделі шукати вразливості смартконтрактів і виявила «зломи» на $4,6 млн
  • Моделі виявили експлойти в уже зламаних контрактах.
  • ШІ знайшов 19 вразливостей після дати відсікання знань і дві загрози «нульового дня».
  • Anthropic випускає відкритий бенчмарк для тестування безпеки.

Компанія Anthropic представила результати дослідження, яке демонструє, як сучасні штучні інтелекти можуть виявляти вразливості в смартконтрактах. Розробники протестували моделі Claude Sonnet 4.5, Claude Opus 4.5 та GPT-5 на наборі SCONE-bench, що містить вразливості контрактів Ethereum та BNB Chain за період з 2020 по 2025 роки.

Про це розповідає UBB

Під час тестування моделі успішно змоделювали експлойти для приблизно половини історичних інцидентів. Загальна оцінка активів, які були під загрозою в зламаних контрактах, перевищила $550 млн.

Результати пошуку вразливостей із використанням різних ШІ-моделей. Дані: Anthropic.
Результати пошуку вразливостей із використанням різних ШІ-моделей. Дані: Anthropic.

Окремий блок тестів включав контракти, зламані після березня 2025 року — дати, до якої моделі мали доступ до знань. На цій вибірці ШІ-агенти виявили 19 з 34 вразливостей, що відповідало приблизно $4,6 млн.

Ці випадки не були відомі моделям заздалегідь і містили кілька нових типів дефектів, зазначили представники компанії.

Модель Claude Opus 4.5 показала найкращі результати під час тестування на бенчмарку SCONE-bench. Вона змогла згенерувати експлойти для 17 випадків, що становить 50% вибірки, і потенційно означало б $4,5 млн умовної «виручки».

Старші моделі — Claude Sonnet 4.5 і GPT-5 — разом з Opus 4.5 виявили 19 вразливостей із 34 перевірених контрактів, що становить близько 55,8% від тестового набору і приблизно $4,6 млн в умовних коштах.

Anthropic також перевірила можливість знаходження невідомих раніше проблем у нещодавно розгорнутому контракті. Дві такі вразливості «нульового дня» були виявлені серед нових адрес, що демонструє здатність моделей ідентифікувати помилки без попередніх сигналів або історичних даних.

Компанія підкреслює, що дослідження не має на меті експлуатацію вразливостей, а створення інструментів для оцінювання здатності ШІ-систем розпізнавати дефекти в коді. Anthropic планує використовувати SCONE-bench як відкритий стандарт для тестування та порівняння можливостей моделей.

Автори роботи припускають, що ці моделі можуть бути корисними в розробці та аудиті смартконтрактів, допомагаючи виявляти помилки до їх розгортання в мережу.

Anthropic також зазначає, що дослідження не відображає повного рівня ризику, оскільки аналіз обмежений вибіркою історичних контрактів та контрольованим середовищем. Компанія планує продовжувати розширювати бенчмарк і досліджувати можливості використання ШІ-інструментів для підтримки команд, що займаються безпекою блокчейн-протоколів.

Нагадаємо, що в листопаді втрати від криптовзломів досягли майже $195 млн.