Вчені зробили ШІ грубішим — і він став розумнішим

Японські вчені дозволили штучному інтелекту перебивати співрозмовників, мовчати, коли нема що сказати, і вступати в розмову поза чергою — і це зробило його значно точнішим у складних завданнях, повідомляє Live Science. Дослідники з Університету електрокомунікацій у Токіо створили систему, де ШІ-агенти з різними характерами обговорювали проблеми так, як це роблять люди — з усіма недосконалостями живого спілкування. Результати змусили переосмислити сам підхід до того, як штучний інтелект має вести діалог.

1 Березня 2026 о 17:39|Наука і технології|⏱ 5 хв читання|Поділитися:

Мультяшний робот із червоними очима в кросівках, ілюстрація до статті про дослідження грубого штучного інтелекту

Фото: Midjourney | 1920×1080

Чому ШІ спілкується не так, як люди

Уявіть типову робочу нараду. Хтось починає пояснювати ідею, колега раптом перебиває — бо помітив помилку. Інший мовчить, бо поки не має що додати. Хтось говорить надто емоційно, а хтось — занадто обережно. Це нормальне людське спілкування: хаотичне, емоційне, з паузами й перебиваннями.

Штучний інтелект працює зовсім інакше. Сучасні мовні моделі спілкуються за суворим протоколом: отримай запит, сформулюй відповідь, видай результат, чемно зачекай на наступну команду. Це як нарада, де кожен суворо чекає своєї черги і ніколи не перебиває — навіть якщо бачить, що колега каже відверту дурницю.

«Сучасні мультиагентні системи часто виглядають штучно, бо їм бракує тих хаотичних, динамічних ритмів справжньої людської розмови», — пояснив співавтор дослідження Юіті Сей, професор департаменту інформатики Університету електрокомунікацій у Токіо.

Як вчені «олюднили» розмову між ШІ

Команда вирішила дати штучному інтелекту те, що ми сприймаємо як належне: здатність перебивати, мовчати або раптово вступати в розмову.

Для цього вони інтегрували у мовні моделі риси характеру за так званою «Великою п’ятіркою» — класичною психологічною моделлю, яка описує людську особистість через п’ять базових вимірів.

Відкритість до досвіду — наскільки людина (або, у цьому випадку, ШІ) готова сприймати нові ідеї.
Сумлінність — наскільки організовано та відповідально вона підходить до завдань.
Екстраверсія — наскільки активно вона прагне взаємодіяти з іншими.
Доброзичливість — наскільки вона схильна погоджуватися та уникати конфліктів.
Нейротизм — наскільки вона емоційно нестабільна та тривожна.

Кожен ШІ-агент отримав свій «характер» — унікальну комбінацію цих рис. Один міг бути відкритим, але тривожним. Інший — екстравертним і прямолінійним. Як ми раніше писали, дослідники Anthropic вже показували, що ШІ-моделі здатні «грати ролі» — і ця здатність виявляється набагато глибшою, ніж простий набір інструкцій.

Технічний трюк, який усе змінив

Але самого характеру було недостатньо. Потрібно було змінити і механіку розмови.

Зазвичай мовна модель генерує повну відповідь цілком, перш ніж «передати слово» наступному учаснику. Токійська команда перепрограмувала систему так, щоб ШІ обробляв відповіді речення за реченням. Це дозволило кожному агенту «слухати» інших у реальному часі й реагувати миттєво — а не чекати, поки співрозмовник закінчить.

Окрім того, дослідники ввели так званий «показник терміновості». Це внутрішня метрика, яку кожен агент розраховував у процесі розмови. Якщо модель помічала помилку або вважала, що має критично важливу думку — показник терміновості зростав, і агент міг перебити співрозмовника, незалежно від того, чия зараз «черга» говорити. Якщо ж показник був низьким — агент просто мовчав, розуміючи, що додати нічого конкретного.

Цей простий механізм мав неочевидний ефект: він зменшив «інформаційний шум». Замість того, щоб кожен агент обов’язково щось говорив у свою чергу (навіть якщо це було повторення чужої думки), система дозволяла мовчати — і від цього дискусія ставала якіснішою.

Три режими дискусії — і вражаючі результати

Дослідники порівняли три формати спілкування між ШІ-агентами.

Перший — фіксований порядок. Агенти говорили суворо по черзі, як у шкільній грі «передай слово сусідові». Другий — динамічний порядок. Хто мав що сказати — той і говорив, але без права перебивати. Третій — динамічний порядок з перебиваннями. Повна свобода: можна мовчати, можна перебивати, можна вступати в розмову, коли вважаєш за потрібне.

Тестували на серйозному бенчмарку — MMLU (Massive Multitask Language Understanding), стандартному тесті для оцінки розумових здібностей ШІ, що включає питання з науки, гуманітарних дисциплін та інших галузей. Команда використала 1 000 питань із цього набору.

Результати виявилися красномовними.

У ситуації, коли один з агентів спочатку давав неправильну відповідь, точність у режимі фіксованого порядку становила 68,7%. Динамічний порядок підвищив її до 73,8%. А з увімкненими перебиваннями точність зросла до 79,2%.

Ще цікавіше — у складнішому сценарії, коли два агенти стартували з помилкових відповідей. Фіксований порядок — 37,2%. Динамічний — 43,7%. З перебиваннями — 49,5%.

Різниця між «чемним» і «грубим» форматом виявилася не просто статистично значущою — вона була практично відчутною. Кожен третій випадок, коли ввічливе обговорення призводило до помилки, «грубий» формат виправляв.

Чому грубість працює

Пояснення парадоксально просте. У реальних дискусіях між людьми перебивання — це не просто нечемність. Це сигнал пріоритету. Коли хтось перебиває, це зазвичай означає:

«Зачекай, тут критично важливий момент, який ти пропускаєш».

У суворо регламентованій дискусії помилка може «пережити» кілька раундів обговорення, бо кожен чемно чекає своєї черги, перш ніж вказати на неї. За цей час інші агенти можуть навіть «переконатися» в правильності помилкової відповіді — просто тому, що ніхто не заперечив одразу.

З перебиваннями — навпаки. Агент із високим показником терміновості миттєво втручається: «Стоп, тут помилка». Це запобігає ефекту «снігової кулі», коли неправильна ідея накопичує підтримку просто через відсутність негайного спротиву.

А механізм мовчання працює з іншого боку — він фільтрує інформаційний шум. Замість того, щоб штучно генерувати «вклад у дискусію» заради самого факту участі, агент із низьким показником терміновості просто промовчить. І це робить загальну дискусію чистішою.

Що далі: ШІ з характером у реальних командах

Професор Сей вже планує наступний крок: випробувати «характерних» ШІ-агентів у реальних сценаріях — від творчого брейнстормінгу до групового прийняття рішень.

«У майбутньому ШІ-агенти будуть дедалі частіше взаємодіяти один з одним і з людьми в спільних проєктах», — говорить він. «Наші результати свідчать: дискусії, де на поведінку впливає характер — включно зі здатністю перебивати, коли це необхідно — іноді дають кращі результати, ніж суворо впорядковані та одноманітно ввічливі обговорення».

Фактично, дослідження натякає на майбутнє, де команда ШІ-агентів може працювати як справжня група людей — зі своїми «сильними» та «слабкими» сторонами характеру, які доповнюють одне одного.

Чому це важливо знати

Це дослідження змінює уявлення про те, яким має бути ефективний штучний інтелект. Замість ідеально ввічливих і структурованих відповідей, реальний прогрес може ховатися саме в «людських недосконалостях» — перебиваннях, паузах, спонтанних реакціях. Для тих, хто працює з ШІ-інструментами або розробляє їх, це сигнал: наступне покоління систем може стати ефективнішим не завдяки більшій обчислювальній потужності, а завдяки більшій соціальній «людяності».

Автор