Два роки тому науковці з Массачусетського технологічного інституту (MIT) вразили світ сміливою теорією: чим потужнішими стають моделі штучного інтелекту, тим симетричнішими вони є у своєму сприйнятті світу. Проте нове дослідження вчених Федеральної політехнічної школи Лозанни (EPFL) повністю спростувало цю ідею, довівши, що реальність набагато складніша.
Крах Платонівської гіпотези та математична пастка
У 2024 році науковці з MIT висунули так звану “Платонівську гіпотезу представлення”. Вони стверджували, що незалежно від типу даних (текст, відео, аудіо чи зображення), усі розвинуті системи штучного інтелекту поступово приходять до однакової внутрішньої структури розуміння реальності, ніби відкривають універсальні “ідеальні форми” Платона.
Ця ідея ґрунтувалася на високих показниках схожості при порівнянні цифрових векторів таких понять, як “собака”, “дерево” або “автомобіль”.
Однак команда з Лабораторії машинного навчання для біомедицини EPFL вирішила перевірити ці розрахунки і виявила оптичну ілюзію, що ховалася в аномальній математиці багатовимірних просторів.
У чому полягала помилка?
Концентрація відстаней. У надскладних нейромережах діють специфічні закони геометрії. Там навіть абсолютно несвязані між собою випадкові точки з часом виявляються на майже однаковій відстані одна від одної.
Парадокс порожніх моделей. Коли дослідники EPFL порівняли дві абсолютно випадкові, “сирі” моделі штучного інтелекту, які ніколи не проходили навчання і не освоювали жодних даних, метрики все ж показали високий рівень схожості.
Масштабний обман. Виявилося, що з ростом розміру нейромереж показники схожості автоматично зростають з чисто математичних причин, а не тому, що штучний інтелект починає краще розуміти світ.
Читайте більше: ІІ навчився працювати як людський мозок: смартфони та дрони отримають більше автономії
Нова теорія: чому Аристотель переміг Платона
Результати детального аналізу змусили науковців відмовитися від ідеї глобального злиття світоглядів штучного інтелекту. Натомість вони запропонували нову “Аристотелівську гіпотезу представлення”.
Пояснення:
Якщо Платон шукав абсолюти, то його учень Аристотель зосереджувався на контексті, категоріях і зв’язках. Експерименти довели, що нейромережі дійсно демонструють схожість, але лише на локальному рівні.
Тобто різні штучні інтелекти однаково розуміють, які об’єкти повинні бути поруч (наприклад, вантажівка буде знаходитися в одному кластері з легковим автомобілем, а кіт – з собакою). Проте глобальна геометрія простору та загальна логіка мислення у кожної моделі залишаються унікальними та радикально відрізняються.
Що це означає для майбутнього технологій?
Науковий спір може здаватися занадто абстрактним, проте він має величезне практичне значення для розробників. Раніше інженери сподівалися, що якщо всі потужні штучні інтелекти з часом почнуть мислити однаково, їх буде дуже легко об’єднувати між собою, створювати мультимодальні системи (де текст і зір працюють як одне ціле) і контролювати їх безпеку.
Тепер зрозуміло, що єдиного універсального коду мислення не існує.
Розробникам доведеться створювати абсолютно нові інструменти для вирівнювання та синхронізації різних штучних інтелектів, враховуючи їх фундаментальні відмінності.
Автори оригінальної теорії з MIT вже визнали правоту швейцарських колег, назвавши це відкриття важливим проривом для комп’ютерних наук.