Вчені навчили штучний інтелект сумніватися.

Дослідники з Корейського передового інституту науки і технологій (KAIST) представили новий метод навчання нейронних мереж, який робить їх прогнози значно надійнішими. Цей підхід дозволяє ІІ надавати прагматичні оцінки впевненості у власних відповідях.
Чому ІІ “веде себе” самовпевнено?
Вчені пояснюють: більшість сучасних ІІ-систем використовує глибоке навчання на основі багатошарових нейронних мереж. Під час роботи вони генерують не лише відповідь, але й оцінку впевненості в її точності.
Проте практика демонструє, що ІІ часто робить помилки, представляючи їх як підтверджені факти з високим рівнем ймовірності.
На думку дослідників Чонхвана Чхона і Се-Бум Пайка, причиною цієї проблеми є стандартний метод ініціалізації моделей (послідовність дій, що передують виконанню програми), який тривалий час вважався еталонним. Саме він закладає основу для подальшої надмірної впевненості системи.
Метод “нейроразминки”: у чому новизна
Щоб усунути цей недолік, вчені розробили стратегію “розминки”, натхненну розвитком людського мозку.
Процес виглядає наступним чином:
Навчання на шумі: перед початком роботи з реальними даними нейронну мережу коротко тренують на випадковому шумі (даних без логічних патернів) та довільних результатах.
Калібрування: під час цієї фази мережа вчиться не шукати закономірності там, де їх немає – саме це формує правильне “розуміння” ІІ поняття невизначеності.
Основне навчання: лише після такої підготовки модель починає вивчати специфічні завдання на реальних наборах даних.
Результати
Дослідники зазначають: порівняння зі стандартними методами виявилося “вражаючим”. Моделі, які пройшли “розминку”, значно краще ідентифікували невідомі вхідні дані та надавали низькі оцінки впевненості для своїх помилкових прогнозів. При цьому вони зберігали високу впевненість лише у правильних відповідях.
Чому це важливо
Вчені KAIST підкреслюють: основна перевага нового підходу полягає в його простоті. Він не вимагає складного інженерного втручання або додаткової обробки даних після навчання. Досить лише короткої підготовчої сесії перед початком основного тренування алгоритму.
У перспективі це допоможе створити більш безпечні системи ІІ для діагностики захворювань, де хибна впевненість може призвести до неправильного лікування, або для систем автопілота, де неточна оцінка ситуації на дорозі загрожує аваріями.
Вчені планують розвивати новаторський метод, щоб застосувати його до більш широкого спектра ІІ-моделей у реальних ситуаціях по всьому світу.