Новий штучний інтелект, змодельований за принципами роботи мозку, перевершив LLM у задачах на логіку
Науковці з сінгапурської компанії Sapient створили нову систему штучного інтелекту — Hierarchical Reasoning Model (HRM), яка відтворює спосіб обробки інформації людським мозком. Як повідомляє Live Science, ця модель продемонструвала кращі результати у складних тестах на логічне мислення порівняно з провідними мовними моделями, включаючи ChatGPT.
Дослідження, опубліковане 26 червня на платформі препринтів arXiv, описує систему, що базується на принципі ієрархічної та багатошвидкісної обробки даних, характерної для людського мозку. Різні відділи мозку інтегрують інформацію протягом різних часових інтервалів — від мілісекунд до хвилин. Аналогічно, HRM використовує модулі для абстрактного планування та швидких деталізованих обчислень.
Вражаючі результати при мінімальних ресурсах
HRM має лише 27 мільйонів параметрів і навчалася на тисячі прикладів. Для порівняння: сучасні великі мовні моделі оперують мільярдами чи навіть трильйонами параметрів. За оцінками експертів, нещодавно представлена GPT-5 може мати від 3 до 5 трильйонів параметрів.
Результати тестування ARC-AGI
У бенчмарках ARC-AGI — складних тестах, що вимірюють наближення до штучного загального інтелекту (AGI) — HRM показала вражаючі результати:
ARC-AGI-1:
- HRM — 40,3%
- OpenAI o3-mini-high — 34,5%
- Anthropic Claude 3.7 — 21,2%
- Deepseek R1 — 15,8%
ARC-AGI-2 (складніший тест):
- HRM — 5%
- o3-mini-high — 3%
- Deepseek R1 — 1,3%
- Claude 3.7 — 0,9%
Чим HRM відрізняється від ChatGPT та інших LLM
Більшість сучасних мовних моделей використовують метод «ланцюга думок» (Chain-of-Thought, CoT), розкладаючи складне завдання на послідовність простіших кроків, виражених природною мовою. Однак автори дослідження вказують на ключові недоліки цього підходу: «крихка декомпозиція завдань, великі вимоги до даних та висока затримка».
HRM працює принципово інакше. Система виконує послідовні завдання логічного мислення за один прохід, без явного контролю проміжних кроків. Двомодульна структура включає:
- Модуль високого рівня — відповідає за повільне абстрактне планування
- Модуль низького рівня — здійснює швидкі та деталізовані обчислення
Модель застосовує метод ітеративного уточнення — обчислювальну техніку, що покращує точність рішення через багаторазове вдосконалення початкового наближення. Кожен «сплеск мислення» визначає, чи продовжувати процес обдумування, чи подати остаточну відповідь.
Практичні успіхи: від судоку до лабіринтів
HRM продемонструвала майже ідеальну продуктивність у розв’язанні складних головоломок судоку — завдань, з якими традиційні LLM не справлялися. Модель також показала відмінні результати в оптимальному пошуку шляхів у лабіринтах.
Ці приклади демонструють здатність системи до комплексного логічного мислення та просторової орієнтації — областей, де класичні мовні моделі традиційно відчувають труднощі.
Критичний погляд: що насправді забезпечило прорив
Хоча дослідження ще не пройшло рецензування, організатори бенчмарку ARC-AGI спробували відтворити результати після того, як автори відкрили код моделі на GitHub.
Незалежні дослідники підтвердили заявлені показники, але зробили несподівані висновки. За їхніми спостереженнями, ієрархічна архітектура мала мінімальний вплив на продуктивність. Натомість ключову роль відіграв недостатньо задокументований процес уточнення під час навчання, який забезпечив суттєве підвищення ефективності.
Чому це важливо знати
Для України, яка активно впроваджує технології штучного інтелекту у військовій сфері та стратегічному плануванні, поява HRM відкриває нові можливості. Модель, здатна ефективніше розв’язувати логічні задачі при мінімальних обчислювальних ресурсах, може революціонізувати підходи до використання ШІ в обороні, логістиці та управлінні безпілотними системами.
Важливий урок HRM полягає в тому, що кількість параметрів не завжди визначає успіх. Інноваційні архітектури можуть досягати кращих результатів при значно менших витратах ресурсів. Для українських дослідників та інженерів критично важливо відстежувати такі розробки — вони можуть стати основою для створення гнучких, економічних систем, придатних для реального застосування в умовах війни та майбутньої відбудови країни.
Відкритий код моделі на GitHub створює додаткові можливості для української технологічної спільноти долучитися до розвитку та адаптації цієї технології під національні потреби.