Чому штучний інтелект досі не вміє вчитися як людина
Міжнародна група дослідників створила систему WorldTest для оцінки того, наскільки добре штучний інтелект розуміє навколишній світ. Результати виявилися несподіваними: люди демонструють результати майже вчетверо кращі, ніж найсучасніші моделі ШІ, зазначено у дослідженні Benchmarking World-Model Learning.
- Чому люди краще за ШІ розуміють світ?
У дослідженні 517 учасників тестували здатність розуміти світ. Люди показали середній результат 0,94 зі можливого 1,0, тоді як найкраща модель ШІ досягла лише 0,26. - Що заважає ШІ навчатися ефективно?
Моделі не вміють систематично експериментувати та змінювати свої висновки при зустрічі з новими фактами — навіть збільшення обчислювальної потужності допомагає лише у 58% випадків. - Які наслідки для розвитку ШІ в Україні?
Поки Україна готується запустити власну модель штучного інтелекту до кінця 2025 року, дослідження показує критичний розрив між амбіціями та реальними можливостями технології.
Як тестували розуміння світу
Дослідники з Basis Research Institute, MIT та провідних університетів розробили 43 інтерактивні середовища-головоломки, де агенти спочатку вільно досліджують світ без конкретних завдань, а потім отримують тести на передбачення, планування та виявлення змін.
517 учасників із платформи Prolific змагалися проти трьох найпотужніших моделей: Claude 4 Sonnet від Anthropic, o3 від OpenAI та Gemini 2.5 Pro від Google. Люди показали середній результат 0,94 із можливого 1,0. Найкраща модель o3 досягла лише 0,26 — майже вчетверо гірший показник.
Навіть коли моделям давали більше часу та обчислювальних ресурсів, покращення спостерігалися лише в 25 з 43 середовищ. У решті 18 випадків додаткові ресурси не допомагали взагалі.

Чому ШІ програє людям у вивченні світу
Дослідники виявили дві критичні проблеми сучасних моделей штучного інтелекту.
Перша — неефективне дослідження. Люди використовували кнопку «перезавантаження» у 12,5% своїх дій, систематично перевіряючи гіпотези про правила середовища. Натомість Claude 4 Sonnet використовував цю функцію лише у 2,1% випадків, вважаючи за краще безладно клікати по екрану.
Друга проблема — нездатність змінювати думку. Навіть коли моделі бачили, що їхні припущення суперечать реальності, вони продовжували покладатися на первинні висновки. Людина в подібній ситуації переглядає свою модель світу, ШІ — застрягає.
Моделі застрягають на першому висновку і не можуть від нього відмовитися, навіть коли факти кажуть інше. Люди ж постійно переглядають своє розуміння світу, коли стикаються з чимось новим — саме так ми навчаємося протягом життя.

Що означає відсутність «інстинктів» у машин
У біологічних організмів є вроджені приори — базові очікування про те, як влаштований світ. Дитина знає, що об’єкти не зникають просто так, що дії мають наслідки, що інші істоти мають наміри. Це результат мільйонів років еволюції.
Сучасні моделі ШІ мають лише статистичні та «книжні» очікування. Вони вивчили мільярди текстів, але це не замінює живого досвіду взаємодії зі світом. Саме тому ChatGPT може написати бездоганний код, але розгубиться в простій фізичній задачі, яку тримісячна дитина розв’яже інтуїтивно.
Коли очікувати прориву
Дослідники запропонували дорожню карту подолання обмежень. Вона включає створення об’єктних та причинних апріорних уявлень — вбудованого розуміння, що світ складається зі стійких речей та причинно-наслідкових зв’язків.
Також потрібні внутрішні моделі світу з можливістю планування, популяційне навчання з комунікацією між агентами та нормативні обмеження на кшталт RLHF.
Найскладніше — поєднати все це разом: онлайн-оновлення переконань без «забування», довготривалу пам’ять, сенсомоторику та безпечне навчання через експерименти з оцінкою ризиків.
Чому це важливо знати
Дослідження пояснює, чому сучасний ШІ чудово пише коди та генерує тексти, але не може адаптуватися до несподіваних ситуацій. Розрив між людським та машинним навчанням залишається величезним, незважаючи на мільярдні інвестиції.
Для України це означає необхідність реалістичних очікувань від національної моделі ШІ. Технологія може стати потужним інструментом для конкретних завдань — аналізу документів, перекладу, систематизації даних. Але до роботів з людським розумінням світу залишається ще десятиліття досліджень.
Джерело: https://arxiv.org/abs/2510.19788