Штучний інтелект майбутнього має вміти грати за новими правилами
Щоб створити потужний і безпечний штучний інтелект, його слід навчити не лише розуміти, а й строго дотримуватися нових правил — навіть найнезвичніших. Про це пише Scientific American у статті Вінея К. Чаудрі за редакцією Дена Верґано.
У матеріалі пропонується новий спосіб тестування штучного інтелекту, натхненний іграми з варіативними правилами — від реверсивних «хрестиків-нуликів» до тривимірних версій на кубах. В основі ідеї — здатність ШІ не просто навчатися на відомих сценаріях, а й адаптуватися до незнайомих умов у реальному часі.
Автори пропонують так званий тест Ґарднера (Gardner test) — нову перевірку загального інтелекту систем ШІ. У цьому тесті модель має зіграти в гру за правилами, які оголошуються тільки на старті, без попереднього навчання чи людського втручання.
Що таке тест Ґарднера
Названий на честь Мартіна Ґарднера, легендарного популяризатора математичних головоломок у Scientific American, цей тест ґрунтується на концепції General Game Playing (GGP) — напрямку досліджень, започаткованому професором Стенфордського університету Майклом Дженезеретом. У змаганнях GGP моделі ШІ змагаються в незнайомих іграх, правила яких записані формальною математичною мовою й розкриваються лише на початку гри.
Нова версія тесту підіймає планку: ШІ повинен сприймати й розуміти правила, сформульовані природною мовою (наприклад, англійською). Завдяки проривам у великих мовних моделях (LLM) на кшталт ChatGPT, Claude чи Llama це нарешті стало технічно можливим.
Тест може включати різноманітні ігри — від класичних Connect Four, Hex і Pentago до екзотичних варіантів із колекції самого Ґарднера. Розробники підкреслюють: головне завдання — не просто навчити ШІ вигравати, а навчити його точно дотримуватися будь-яких нових правил, якими б дивними вони не були.
Чим тест Ґарднера відрізняється від існуючих підходів
Сучасні топові моделі, як-от AlphaZero, демонструють надлюдські результати в шахах, ґо та сьоґі (японських шахах). Однак вони потребують наперед заданих правил для навчання. Система вчиться через «самонавчання грою» (self-play) — багаторазово граючи проти власної копії. Але цей метод працює лише в замкнених системах із фіксованими умовами.
Як зазначають автори, якщо представити AlphaZero гру, відмінну від тих, які вона вивчила, система буде повністю збентежена. Її здатність опановувати складні ігри вражає, але це крихка система — вона не може адаптуватися до нових правил.
Натомість AI, що успішно пройде тест Ґарднера, зможе адаптуватися до нових правил навіть за відсутності даних для навчання. Він гратиме в будь-яку гру й дотримуватиметься будь-якого нового набору правил із точністю.
Чому точність важливіша за креативність
На перший погляд, багато генеративних систем ШІ можуть грати в варіанти простих ігор. ChatGPT, наприклад, здатний грати у варіант «хрестиків-нуликів» 4×4 або 5×5. Проте підказка для LLM — це радше пропозиція, ніж конкретний набір правил. Саме тому нам часто доводиться вмовляти, підштовхувати й налаштовувати LLM, щоб вони робили саме те, що ми хочемо.
Справжній загальний інтелект, який пройде тест Ґарднера, за визначенням зможе ідеально дотримуватися правил. Недотримання правила означатиме провал тесту.
У критично важливих сферах це питання життя і смерті. У контексті національної безпеки потрібні системи ШІ, які можуть точно застосовувати правила ведення бою в динамічних умовах або розрізняти тонкі, але критичні відмінності в юридичних повноваженнях. У фінансах з’являються програмовані гроші — нова форма валюти з правилами власності та передачі. Неправильне застосування цих правил може призвести до фінансової катастрофи.
Парадокс: слухняність веде до гнучкості
Іронія в тому, що побудова систем ШІ, здатних суворо дотримуватися правил, зрештою дозволить створити машинний інтелект, набагато більш схожий на людський у своїй гнучкості та здатності адаптуватися до невизначених і нових ситуацій.
Коли ми думаємо про людей-гравців, то уявляємо спеціалістів: Магнус Карлсен — геніальний шахіст, але, можливо, не такий успішний у техаському холдемі. Справа, однак, у тому, що люди здатні до узагальнення. Якби Карлсен покинув шахи, він міг би стати гідним претендентом на чемпіонат Pentamind, який відзначає найкращого універсального гравця.
Саме ця здатність — грати в ігри з новими правилами — критично важлива для наступної еволюції ШІ. Вона потенційно дозволить створити системи, здатні на все, але які ретельно й надійно дотримуватимуться встановлених нами правил.
Чому це важливо знати
Розробка безпечного ШІ — це питання не лише продуктивності, а й контролю та передбачуваності. У військовій, фінансовій та юридичній сферах нездатність точно дотримуватися нових правил — це ризик, якого людство не може собі дозволити.
Для України, яка веде війну та покладається на високотехнологічні рішення, це особливо актуально. ШІ, що динамічно пристосовується до нових умов бою чи правил міжнародного права, може стати вирішальним фактором у захисті, відновленні та розвитку Української держави.
Тест Ґарднера відкриває шлях до створення гнучкого, але контрольованого інтелекту — системи, здатної адаптуватися, не порушуючи довіру. У світі, де правила змінюються щодня, це не просто бажана опція — це основа безпеки та розвитку в умовах нової реальності.