Як ШІ зрозумів абракадабру: відкриття вчених Google
Великі мовні моделі здатні відновлювати зміст тексту, в якому всі значущі слова замінені на безглузді набори літер — наприклад, перекладати «He dwushed a ghanc zawk» як «He dragged a spare chair». Таку здатність виявили вчені з Університету Вісконсину та Google у новому дослідженні, яке кидає виклик поширеній думці про ШІ як «стохастичного папугу». Розпізнавання патернів — не альтернатива «справжньому» інтелекту, а його ключовий інгредієнт, стверджують автори.

Що зробили вчені
Назва дослідження — «The Unreasonable Effectiveness of Pattern Matching» — відсилає до знаменитого вірша Jabberwocky Льюїса Керолла з книги «Аліса в Задзеркаллі» (1871). У тому вірші більшість слів вигадані, але читач все одно відчуває їхній зміст завдяки збереженій граматичній структурі.
Гері Лупьян з факультету психології Університету Вісконсин-Медісон та Блейз Агуера-і-Аркас з команди Google Paradigms of Intelligence вирішили перевірити, чи здатні мовні моделі робити те саме — але з набагато складнішими текстами. Вони брали звичайні англомовні тексти і замінювали всі значущі слова на випадкові безглузді рядки, зберігаючи лише службові слова та граматичну структуру.
Потім просили моделі «перекласти» отримані нісенітниці назад на нормальну мову. Результати виявилися вражаючими.

Три приклади, що вражають
Перший тест — юридичний текст про верховенство федерального права США. Усі ключові слова замінені на абракадабру: «Staught Splunk» замість «United States», «phlaint» замість «law». Модель Gemini 2.5 Pro від Google відновила не лише загальний зміст, а й конкретні юридичні поняття — визнання закону недійсним, вимоги до маркування товарів, заборону штату застосовувати власний закон.
Другий — свіжий спортивний допис з ESPN, гарантовано відсутній у тренувальних даних моделі. Числа 88, 884 та $12 мільйонів залишили без змін, а решту «зашифрували». Модель розпізнала контекст американського футболу і правильно визначила, що «88 plonges for 884 spelchs» означає «88 прийомів м’яча на 884 ярди». Самі числа «підказали» моделі тематику і допомогли звузити простір можливих значень.
Третій — допис з Reddit, де хтось питав, чи безпечно їсти голландський продукт ontbijtspek. Коли дослідники додали в «зашифрований» текст єдину підказку — слово «Netherlands» замість безглуздого «Splud» — якість перекладу різко зросла. Модель ChatGPT o3 інтегрувала знання про нідерландську кухню і видала переклад, майже ідентичний оригіналу.

Не папуга і не «розмитий JPEG»
Дискусія про природу мовних моделей не вщухає: одні називають їх «стохастичними папугами», які лише повторюють завчене, інші — як письменник Тед Чіанг у The New Yorker — порівнюють з «розмитим JPEG-файлом інтернету». Нещодавня стаття у Science пропонувала аналогію зі «шухлядою для карток».
Нове дослідження ускладнює всі ці метафори. Wikipedia чи пошуковий рядок не здатні «розшифрувати» речення, де всі слова — нісенітниці. Для цього потрібне глибоке засвоєння мовних конструкцій. Вчені стверджують: мовні моделі засвоїли не «розмиту копію» інтернету, а потужну схему стиснення інформації, яка дозволяє їм відновлювати зміст навіть із сильно деградованих текстів.

Людський мозок працює так само
Автори наголошують: здатність ШІ «перекладати» абракадабру — не ознака якогось «чужорідного» інтелекту, а відображення того, як працює людський мозок. Ми теж покладаємося на розпізнавання патернів — коли читаємо нерозбірливий почерк, розуміємо перекручені слова або вловлюємо суть розмови у шумному приміщенні.
При цьому людське мислення далеке від ідеального логічного калькулятора. Дослідження показують, що люди помиляються навіть у простих задачах — плутають парні й непарні числа, не впізнають трикутники незвичної форми. Наш мозок — це не комп’ютер, що виконує чіткі алгоритми, а потужна система розпізнавання патернів з усіма її перевагами та обмеженнями.
Назва дослідження обіграє відому працю фізика Юджина Вігнера «Неймовірна ефективність математики» (1960). Тільки тепер мова про неймовірну ефективність розпізнавання патернів — як у людей, так і в машин.

Чому це важливо знати
Це дослідження зміщує фокус дискусії про штучний інтелект. Замість питання, чи думає ШІ як людина, воно пропонує інше: «наскільки людське мислення саме і є розпізнаванням патернів?». Якщо інтелект — від людського до штучного — ґрунтується на одному і тому ж механізмі зіставлення шаблонів, це змінює підходи до регулювання ШІ, оцінки його можливостей та визначення завдань, які суспільство готове йому довірити.

Медіаменеджер і автор-фрілансер з 1991 року. Займається креативним продакшном та розвитком медіа.
Усі статті автора →











