Штучний інтелект провалює читання годинника і календаря — дослідження

Штучний інтелект вражає світ генерацією витончених текстів, реалістичних зображень і складного програмного коду, проте, як виявило нещодавнє дослідження, ці ж самі моделі ШІ масово провалюють елементарні для людини завдання — правильно визначити час на звичайному аналоговому годиннику чи обчислити день тижня за календарною датою.

18 Травня 2025 о 0:58|Наука і технології|⏱ 4 хв читання|Поділитися:

Штучний інтелект провалює читання годинника і календаря — дослідження

Авторська ілюстраційна генерація за допомогою Midjourney

Про ці неочікувані обмеження повідомляє науковий портал Live Science, спираючись на презентацію дослідників на Міжнародній конференції з репрезентацій навчання (ICLR-2025) та їхній попередній науковий препринт, опублікований 18 березня на платформі arXiv.

Команда дослідників під керівництвом Рохіта Саксени (Rohit Saxena) з Единбурзького університету перевірила можливості сучасних мультиформатних моделей штучного інтелекту (Multimodal Large Language Models, MLLMs) — зокрема GPT-4o від OpenAI, Claude 3.5 Sonnet від Anthropic, Gemini 2.0 від Google і LLaMA 3.2-Vision від Meta.

Моделям було запропоновано розпізнати час на зображеннях аналогових годинників та вирахувати день тижня за заданими календарними датами. Результати виявилися невтішними:

лише 38,7% відповідей на завдання з годинниками були правильними;
тільки 26,3% — на запити щодо дат у календарі.

Саксена пояснив: «Люди з дитинства вчаться визначати час і користуватись календарем. Наше дослідження показує вражаючий розрив між можливостями ШІ та елементарними когнітивними навичками людини».

Причини провалу моделей
Дослідники виділяють кілька ключових причин слабких результатів:

Відсутність просторового мислення:
Для правильного визначення часу модель має вміти розпізнати перекриття стрілок, вимірювати кути, розпізнавати нестандартні циферблати з римськими цифрами чи декоративними елементами. «Розпізнати, що це годинник — легко. А от прочитати час із нього — складне просторове завдання», — зазначає Саксена.
Проблеми з абстрактним обчисленням дат:
Попри те, що ШІ здатен формально пояснити поняття високосного року, він не може застосувати ці знання в задачах, де потрібно обчислити, наприклад, який день тижня припадає на 153-й день року. «Для комп’ютера арифметика — базова функція. Але великі мовні моделі не виконують обчислень — вони передбачають відповіді за шаблонами з навчальних даних», — зауважує Саксена.
Дефіцит прикладів у тренувальних наборах:
Дані, які стосуються рідкісних ситуацій, як-от високосні роки чи нестандартні формати календарів, трапляються в навчанні моделей рідко. Через це ШІ не формує стабільних логічних правил.

Контекст і висновки: межі штучного інтелекту

Це дослідження додає ще один важливий елемент до зростаючого переліку фундаментальних обмежень сучасного ШІ. За іронією долі, моделі, здатні писати поезію та аналізувати складні тексти, але губляться перед завданнями, які людина опановує у початковій школі.

Як влучно зазначає Рохіт Саксена: «ШІ — потужний інструмент, але коли завдання поєднує зорове сприйняття з точними логічними міркуваннями, нам все ще потрібні системні перевірки, резервні алгоритми й, у багатьох випадках, безпосередній людський контроль».

Ці висновки набувають особливого значення в контексті активного впровадження ШІ у критично важливі сфери. Системи, які неправильно інтерпретують час, потенційно створюють серйозні ризики у:

Транспортній галузі – від складання розкладів руху потягів до навігаційних систем автономних автомобілів;
Медицині – де точний розрахунок часу може бути життєво важливим при дозуванні ліків чи плануванні процедур;
Промисловій автоматизації – де синхронізація виробничих процесів критично впливає на безпеку та якість;
Логістиці та плануванні поставок – де помилки в часових розрахунках можуть призвести до значних економічних втрат.

Дослідники підкреслюють: доки ці обмеження існують, повна автономність ШІ у часово-критичних системах залишається небезпечною фантазією, а не реальною перспективою, у сфері автоматизації, логістики, навігації або допоміжних технологій.

Чому це важливо знати

Попри вражаючі досягнення в генерації текстів, зображень і вирішенні складних завдань, ШІ має фундаментальні прогалини у базових когнітивних навичках, зокрема у сприйнятті часу й простору. Це означає, що автоматизація в критичних сферах (розклад, логістика, планування) вимагає особливої обережності.

Навіть наш власний ШІ-помічник на сайті Kyiv.News, який постійно навчається на наших матеріалах, може заплутатись у числах або датах — і це не його індивідуальна вада, а системна проблема всіх сучасних моделей штучного інтелекту. Коли ви бачите помилку в обчисленнях від ChatGPT чи іншої моделі, пам’ятайте: це відображення глибших обмежень технології, а не просто поодинокий збій.

Важливо розуміти: ШІ не є заміною людської логіки — особливо там, де йдеться про точність, часові розрахунки та здоровий глузд. Технології доповнюють наші можливості, але критичне мислення та перевірка залишаються незамінними людськими навичками в епоху штучного інтелекту.

Автор