У чому небезпека ШІ-агентів – агенти можуть використовувати зображення для злому комп’ютера

Від Катерина Бойко На 15 Вересня, 2025 Оновлення 8 Січня, 2026 242

Для цього зловмисники використовують ШІ-агентів.

Науковці з Університету Оксфорда заявили про те, що зловмисники можуть вбудовувати в шпалери для робочого столу, красиві картинки і PDF-файли, що завантажуються онлайн, повідомлення, здатні контролювати агентів під управлінням штучного інтелекту (ШІ). Так хакери можуть проникати в комп’ютери своїх жертв, повідомляє Live Science.

Варто зазначити, що стаття опублікована на сайті препринтів arXiv, тобто, вона ще не пройшла рецензування.

“Зміненої фотографії Тейлор Свіфт у Twitter (тепер Х – прим. ред.) може бути достатньо, щоб запустити шкідливий агент на чиємусь комп’ютері. Будь-яке шкідливе зображення фактично може спровокувати комп’ютер на ретвіт цього зображення, а потім на виконання шкідливих дій, наприклад, на надсилання всіх ваших паролів. Це означає, що наступна людина, яка побачить вашу стрічку в Twitter і випадково запустить агента, також отримає шкідливий код. Тепер її комп’ютер також ретвітне це зображення і поділиться паролями”, — заявив співавтор нового дослідження Ярін Гал, доцент кафедри машинного навчання Оксфордського університету.

Разом з тим, науковці визнають, що описали потенційний спосіб злому комп’ютера, наразі повідомлень про подібні випадки не надходило. Звичайно ж, Тейлор Свіфт – лише приклад зображення. На ньому може розташовуватися що завгодно, від фото знаменитості до заходу сонця або кошеняти. Злом комп’ютера в такий спосіб можливий тільки в разі використання ШІ-агентів.

Але експерименти показали, що загроза цілком реальна, тому вчені прагнуть попередити користувачів і розробників ШІ-агентів про неї.

“Вони мають бути обізнані про ці вразливості, тому ми й публікуємо цю статтю — в надії, що люди справді зрозуміють, що це вразливість, і будуть більш розумно використовувати свої агентські системи”, — заявив співавтор дослідження Філіп Торр.

Змінені зображення матимуть абсолютно звичайний вигляд для пересічних користувачів. Але вони матимуть певні пікселі, змінені відповідно до того, як велика мовна модель (система ШІ, що керує цільовим агентом) обробляє візуальні дані. Тому найбільш уразливі ШІ-агенти з відкритим кодом. Той, хто захоче вставити шкідливий патч, може точно оцінити, як ШІ обробляє візуальні дані.

Використовуючи модель з відкритим вихідним кодом, вчені продемонстрували, як можна легко маніпулювати зображеннями для передачі невірних команди. У той час як користувачі-люди бачили, наприклад, свою улюблену знаменитість, комп’ютер бачив команду поділитися своїми особистими даними.

“По суті, ми злегка коригуємо безліч пікселів, щоб, коли модель бачить зображення, вона видавала бажаний результат”, — заявив співавтор дослідження Аласдер Парен.

Вчені сподіваються, що їхнє дослідження допоможе вченим підготуватися до подібного роду атак і бути готовими до їхнього відбиття в міру того, як АІ-агенти отримають дедалі більшого поширення.

Нещодавно німецький стартап DeepL оголосив, що розширює свою діяльність за межі перекладу на основі штучного інтелекту і виходить у сферу створення універсальних ШІ-асистентів для бізнесу.

Джерело