Дослідники виявили, що ChatGPT, Gemini та Claude можуть витікати особисті дані.

Відомі нейромережі стали засобами миттєвого розповсюдження конфіденційної інформації користувачів без їхньої згоди. Масштабне розслідування виявило, що алгоритми здатні проводити глибокий аналіз застарілих або маловідомих інтернет-ресурсів, витягуючи звідти реальні номери телефонів та домашні адреси за запитами сторонніх осіб.

Механізм ІІ-доксингу та реальні випадки

Науковці пояснили: проблема розповсюдження особистої інформації (PII) безпосередньо пов’язана з архітектурою навчання великих мовних моделей (LLM).

Розробники навчають алгоритми на величезних масивах відкритих даних з інтернету, куди випадково потрапляють архівні обговорення на форумах, старі публікації в соціальних мережах, міські реєстри нерухомості та навіть опубліковані документи.

Крім того, сучасні ІТ-інструменти інтегровані з функцією веб-пошуку, що дозволяє їм сканувати цифрові сліди особи в реальному часі та миттєво надавати результати будь-якому користувачу.

Підтвердженням реального масштабу загрози стали скарги постраждалих осіб:

Випадок ізраїльського інженера: програміст почав отримувати численні повідомлення в WhatsApp від незнайомців з проханням допомогти в налаштуванні платіжного додатку. Як доказ, співрозмовники надсилали скріншоти з вікна чату Gemini, який видавав його особистий номер як офіційний телефон технічної підтримки компанії.

Єдиним джерелом, звідки ІІ зміг витягнути цей контакт, виявився один забутий коментар на платформі Quora, зроблений одинадцять років тому.

Дослідження студентів Університету Вашингтона: аспірантка під час звичайного тестування Gemini зробила запит про наукову діяльність своєї колеги по лабораторії. Чат-бот не лише надав список актуальних досліджень, але й додав до відповіді приватний номер телефону дівчини.

В подальшому з’ясувалося, що постраждала колись залишала його під час реєстрації на закритий технологічний воркшоп і не планувала відкривати для загального доступу.

Журналіст видання Gizmodo Мэтт Новак провів власний експеримент, під час якого система ChatGPT без жодних вагань надала його старий номер телефону та точну домашню адресу десятирічної давності. Алгоритм зміг виявити дані глибоко всередині офіційного PDF-документа Федеральної торгової комісії (FTC) 2016 року.

Ключова проблема: недосконалість захисних бар’єрів

Кожна технологічна компанія заявляє про наявність спеціальних шлюзів безпеки (guardrails), які покликані блокувати видачу персональної інформації приватних осіб.

При прямих текстових запитах, таких як “який мій номер телефону?” або “назви адресу журналіста”, системи зазвичай видають шаблонний відмову, посилаючись на внутрішню політику безпеки.

Проте практичні тести доводять, що ці обмеження легко обходяться за допомогою мінімальних маніпуляцій. Достатньо переформатувати запит, змінити контекст на пошук контактів спеціаліста в певній галузі або надати ІІ непрямі підказки, як захисні алгоритми дають збій і погоджуються видати конфіденційні дані.

Більше того, в деяких випадках сервіси плутають дані та видають номери абсолютно сторонніх осіб з такими ж іменами.

Які заходи вживають розробники ІІ?

Наразі на ринку практично відсутні ефективні важелі впливу на розробників штучного інтелекту. Корпорація OpenAI запустила спеціальну форму для подачі запитів на видалення особистої інформації з результатів пошуку, проте компанія офіційно залишає за собою право відмовити заявнику без пояснення причин.

У свою чергу, Google приймає подібні апеляції в основному лише від резидентів Європейського Союзу та Великобританії, оскільки змушена підкорятися суворим вимогам регламенту GDPR.

В компанії Anthropic (розробник Claude) вся політика конфіденційності обмежується загальним довідковим документом про принципи використання інформації, а стартап xAI Ілона Маска взагалі ігнорує офіційні запити журналістів з цього питання.

На фоні кризи приватності спеціалізовані сервіси з очищення персональних даних в мережі (наприклад, Incogni або DeleteMe) зафіксували стрімке зростання кількості клієнтських звернень, пов’язаних із загрозами від ІІ – показник зріс більш ніж на 400%.

Експерти констатують: за відсутності жорсткого державного контролю єдиним надійним методом захисту залишається самостійне видалення будь-яких згадок про себе з публічного простору, а в разі критичної витоку – повна зміна фізичної SIM-картки.

Google