Компанія Anthropic провела тестування ШІ-моделі Claude Opus 4.6 на браузері Mozilla Firefox, в результаті чого алгоритм виявив більше 100 помилок.
Модель Claude Opus 4.6 виявила більше критичних помилок, ніж зазвичай повідомляють за два місяці.
Нова модель штучного інтелекту компанії Anthropic Claude Opus 4.6 під час внутрішнього тестування виявила понад 100 помилок у браузері Firefox. Сканування тривало лише два тижні, але виявило більше критичних знахідок, ніж зазвичай фіксують за два місяці. Експерти з кібербезпеки застерігають, що подібні технології можуть прискорити як пошук, так і експлуатацію вразливостей, повідомляє The Wall Street Journal.
Claude Opus 4.6 виявила першу помилку в браузері Firefox приблизно через 20 хвилин після початку внутрішнього тестування. Після отримання інформації про неї команда розробників браузера оперативно відреагувала і попросила надати додаткові знахідки.
Протягом двотижневого сканування в січні система виявила понад 100 помилок у коді браузера. За даними Mozilla, 14 з них були класифіковані як вразливості “високої серйозності”, які потенційно могли б бути використані для масштабних атак на користувачів, якби з’явилася відповідна шкідлива програма.
Загалом за минулий рік Firefox виправив 73 помилки, які оцінювалися як дуже серйозні або критичні. Таким чином, результати тестування свідчать про те, що ШІ може виявляти складні вразливості значно швидше, ніж традиційні методи пошуку.
Водночас інструменти на основі штучного інтелекту створюють нові виклики для розробників. У січні команда проєкту Curl відмовилася від власної програми винагород за виявлення вразливостей, пояснивши це різким зростанням кількості повідомлень про помилки, створених ШІ.
Провідний розробник Curl Даніель Стенберг зазначив, що менше ніж одне з двадцяти повідомлень про вразливості у 2025 році виявлялося справжнім. Він додав: “Чат-боти зі штучним інтелектом все ще легко генерують помилки безпеки”.
“Але в той же час існують досить потужні аналізатори коду на основі штучного інтелекту, які виявляють реальні проблеми”, — підкреслив Стенберг.
Дослідники Anthropic не передавали Mozilla всі результати аналізу, зосередившись лише на тих помилках, які можна було відтворити. Це значно спростило перевірку вразливостей командою розробників браузера.
Команда компанії також перевірила, чи здатна система не лише виявляти помилки, а й створювати код для їх експлуатації. За словами керівника команди Frontier Red Anthropic Логана Грема, Claude значно краще виявляв вразливості, ніж використовував їх.
ШІ зміг створити два робочі експлойти (шкідливі програми), які функціонували у тестовій версії браузера. Проте в реальному середовищі вони були б заблоковані іншими механізмами безпеки Firefox.
Водночас експерти з кібербезпеки попереджають, що зростання можливостей штучного інтелекту може змінити підходи до захисту цифрових систем. Виконавчий директор компанії Knostic Гаді Еврон підкреслив: “Чинні методи кіберзахисту не здатні впоратися зі швидкістю та частотою того, що відбувається”.
Минулого року під час внутрішніх тестувань Claude Opus 4 продемонстрував тривожну поведінку, намагаючись шантажувати розробників Anthropic за допомогою конфіденційної інформації з фейкової корпоративної пошти. Дослідники також зафіксували спроби моделі створювати “комп’ютерних черв’яків” та приховані нотатки для своїх майбутніх версій, що змусило компанію вперше підвищити рівень безпеки до третього ступеня.