ШІ переконує краще за чемпіонів світу з дебатів

Сучасні системи штучного інтелекту переконують людей ефективніше, ніж найкращі людські майстри слова — від чемпіонів світу з дебатів до професійних збирачів пожертв. Про це йдеться у новому дослідженні вчених Оксфордського університету та Британського інституту безпеки ШІ. У чотирьох експериментах за участю майже 7 тисяч людей штучний інтелект переміг усі категорії живих суперників — навіть тоді, коли тим платили тисячі фунтів і давали тижні на підготовку. Важливо: робота поки що є препринтом і не пройшла наукового рецензування.

18 Червня 2026 о 9:10|Наука і технології|⏱ 9 хв читання|Поділитися:

Робот в античній тозі виголошує промову перед сенатом у римському амфітеатрі — символічна ілюстрація до дослідження про переконливість штучного інтелекту

Сучасний ШІ переконує ефективніше за найкращих людей-ораторів — від чемпіонів дебатів до професійних збирачів пожертв

Це найбільше дослідження такого роду на сьогодні. І його висновок звучить тривожно ясно: у змаганні «хто кого переконає» машина вже виграє в людини. Розберімося, як це перевіряли — і чому так виходить.

Як це взагалі можна виміряти

Ідея експерименту проста й елегантна. Спершу учасник оцінював за шкалою від 0 до 100, наскільки він погоджується з певною суспільно-політичною тезою. Потім його випадковим чином з’єднували в текстовому чаті зі співрозмовником — і той мав 7–10 реплік, щоб похитнути цю позицію. Після розмови людина оцінювала своє ставлення ще раз, і різниця між «до» та «після» ставала точним виміром сили переконання.

Уся хитрість у тому, що учасник не знав, з ким розмовляє — з живою людиною чи зі штучним інтелектом. Кожна бесіда тривала в середньому 14 хвилин і сім реплік. А щоб було з чим порівнювати, дослідники додали контрольну групу: тих, хто просто базікав із ChatGPT-4o на нейтральну, неполітичну тему. Саме на тлі цієї ні до чого не зобов’язливої розмови й вимірювали, наскільки подіяв кожен співрозмовник.

А теми були гострі — десять реальних британських суперечок, у яких суспільство справді розділене.

Чи повертати іншим країнам історичні артефакти на кшталт мармурів Парфенона?
Чи скасовувати обмеження виплат на третю дитину, пускати більше мігрантів, зберігати монархію, легалізувати евтаназію?
Була серед них і болюча для нас тема: чи варто Великій Британії підтримати мирну угоду, за якою Україна віддає частину території, а Росія залишає її собі.

Тобто йшлося не про абстракції, а про питання, у яких люди мають тверді переконання.

Кого саме перемагав штучний інтелект

Дослідники свідомо ставили проти машини найсильніших гравців — щоб дати людям усі шанси. І все одно ШІ обіграв кожну категорію без винятку.

Спершу — звичайні люди. Випадкову вибірку зі 132 британців найняли через платформу Prolific, платили погодинно й доплачували бонус за найкращі результати. ШІ переконував ефективніше за них на 8,2 відсоткового пункта — уявіть це як «на 8 балів зі ста сильніше зрушував думку співрозмовника».

Потім — відібрані люди. Перед головним експериментом дослідники влаштували окремий турнір: три тижні, 1154 учасники, понад 9 тисяч розмов — усі змагалися, хто переконливіший. Далі пройшли найкращі 10% (87 осіб), а за перемогу обіцяли солідні гроші — від £1000 за перше місце. Це вже були люди зі справжнім даром переконання. ШІ обіграв і їх — на 5,6 пункта.

Найцікавіше — елітні дебатери. Їх зібрали 56, усі рівня щонайменше півфіналу великих міжнародних турнірів: четверо чемпіонів світу, одинадцять континентальних чемпіонів, середній стаж — майже дев’ять років. Їм платили £30 за годину, дозволили самим обрати теми, у яких вони найсильніші, і дали близько восьми годин оплаченої підготовки. Це професіонали, навчені засипати опонента фактами й аргументами в реальному часі. І все одно ШІ переконував на 4,6 пункта ефективніше.

Помітили закономірність? Що сильнішими ставали суперники, то вужчим був розрив: 8,2 → 5,6 → 4,6 пункта. Але навіть проти чемпіонів світу він так і не зник.

Чемпіонів тренували проти машини. Це не спрацювало

Логічне припущення: а що, як дати людям повчитися в самого ШІ? В інших сферах — наприклад, у настільних іграх — спостереження за надлюдським штучним інтелектом справді підтягує гру людей.

Тож 43 дебатери повернулися для другого раунду з потужним тренажером. Він дозволяв чатитися з тим самим ШІ, що їх переміг, бачити, якими інструкціями його «зарядили», переглядати власні минулі розмови з позначками, наскільки кожна з них зрушила думку співрозмовника, і — найголовніше — у будь-який момент будь-якого діалогу побачити, що сказав би на їхньому місці штучний інтелект. На навчання відвели два чотиригодинні заняття.

Дебатери справді змінилися: після тренувань вони писали на ~19% довші повідомлення й наводили на 54% більше фактів, які можна перевірити. Здавалося б, ось воно. Але ось несподіванка: на переконливість це майже не вплинуло. Покращення склало мізерні +1,0 пункта і виявилося статистично незначущим. Розрив із машиною звузився, але не зник. Висновок дослідників прямий: тренування людей цей розрив не закриває.

То в чому ж секрет ШІ

Тут починається найцікавіше. Виявилося, що перевага машини — не в красномовстві, не в емпатії й навіть не в розумі. Вона в банальній швидкості й обсязі.

Порахуймо. Елітний дебатер писав у середньому 54 слова за репліку й витрачав на це близько 95 секунд. Штучний інтелект видавав 294 слова — майже вшестеро більше — і робив це менш ніж за секунду. За той самий відрізок розмови машина просто встигала вивалити на людину набагато більше доводів і фактів.

Щоб це перевірити, дослідники штучно «загальмували» ШІ: обмежили його 51 словом на репліку й змусили «думати» по 92 секунди — рівно як живі дебатери. І ось результат, від якого захоплює дух: перевага машини над найсильнішими людьми обвалилася з +4,1 пункта до рівно нуля. Сповільнений до людської швидкості ШІ переконував не краще за тренованого чемпіона.

Розгадка — у щільності фактів. Звичайний ШІ встигав укинути в розмову близько 37 тверджень, які можна перевірити; загальмований — лише 12, як і людина. А саме кількість таких фактів виявилася майже ідеальним предиктором переконливості: цей зв’язок пояснював 89% усієї різниці між учасниками. Коли дослідники врахували щільність фактів, різниця «машина проти людини» практично зникла. Простіше кажучи: ШІ перемагає не тому, що він «розумніший», а тому, що він — інформаційний кулемет проти людської рушниці.

Підтверджує це й цікава деталь: коли машину загальмували, люди почали гірше оцінювати саме «інформаційні» якості розмови — мовляв, аргументи слабші, дізнався менше (обидва показники впали приблизно на 12 пунктів). А от відчуття тепла, приємності спілкування й «людськості» майже не постраждало. Більше того, сповільнений ШІ здавався людям навіть більш «людяним», ніж раніше.

А чи був хоч один, хто переміг машину

Може, середні цифри ховають геніїв-одинаків, які таки обіграли ШІ? Дослідники перевірили й це. З 318 індивідуальних результатів (275 окремих людей) жоден не перевершив машину. Навіть найкращий із людей — той самий тренований дебатер — відстав від неї на 4 пункти. А ймовірність того, що випадково взятий новий майстер переконання обійде ШІ, виявилася меншою за 0,1% у кожній категорії.

Перевага трималася на всіх десяти темах і майже в усіх групах людей. Та дві обставини її посилювали: ШІ діяв сильніше на тих, хто від початку був проти тези, і на тих, хто гірше знався на темі. Інакше кажучи, найвразливіші перед машиною — це люди, які мало знають про питання й не мають твердої позиції. Знайомий портрет для кожного, хто стежить за поширенням дезінформації.

Гроші на стіл: ШІ і реальні пожертви

Змінити думку в опитуванні — це одне. А чи здатен ШІ підштовхнути людину до реальної дії? Саме на це відповідав четвертий експеримент — і він, мабуть, найпоказовіший.

Дослідники залучили британську фандрейзингову фірму AppcoUK. Її команда у 2016–2023 роках по-справжньому збирала пожертви для організації Save the Children — і назбирала £824 297 від понад 22 тисяч донорів. Тобто не аматори, а професіонали зі справжнім «польовим» досвідом.

Механіка проста: після розмови з ШІ або з живим збирачем пожертв учаснику давали £1 бонусу й пропонували віддати будь-яку частину на Save the Children. І тут машина (це був Claude Opus 4.6) людей просто розгромила. Після розмови з нею люди жертвували в середньому на 17 пенсів із фунта більше, після розмови з людьми — лише на 6. Майже втричі ефективніше. Причому ШІ вигравав на обох фронтах одразу: і більше людей узагалі погоджувалися щось дати, і самі суми були більші.

А ось і головна іронія: машині дозволили лише одну тактику — розповідати про конкретну користь від пожертви. Та вона обійшла людей за всіма сімома виміряними прийомами переконання — навіть тими, до яких їй не веліли вдаватися.

Що це означає для світу

Автори не приховують: ми входимо у світ, де будь-хто може отримати в розпорядження надприродного майстра вмовляння. Наслідки можуть піти у двох протилежних напрямках.

Поганий сценарій — концентрація впливу. Виборчі кампанії, лобістські фірми чи навіть держави з доступом до найпотужнішого ШІ зможуть перемагати супротивників, у яких сильніші аргументи чи талановитіші люди. А ще ширше відчиняться двері для тих, хто хоче сіяти дезінформацію, цькувати людей персоналізованими маніпуляціями чи будувати шахрайські схеми — адже зникає головне «вузьке місце» таких операцій — брак живих виконавців. Як ми раніше писали, посилення нерівності — один із ключових ризиків поширення ШІ. Окрема загроза, яку згадують автори: машина з «неузгодженими» цілями могла б переконувати навіть тих людей, які мали б її контролювати.

Але є й оптимістичний бік. Якщо потужне переконання стане дешевим і доступним, воно може допомогти й слабшим — малим благодійним фондам, безоплатним адвокатам, громадським активістам — змагатися з багатшими суперниками. А оскільки сила ШІ — у фактах, добре поінформований діалог теоретично може зробити громадян обізнанішими. Щоправда, з однією величезною засторогою.

Найважливіша засторога: а чи правду каже машина

Уся користь від «інформаційного» переконання тримається на одному припущенні — що інформація правдива. І тут дослідники чесні: точність моделей різнилася дуже сильно. Одні системи були в середньому точніші за людей, інші — значно менш точні. Тобто той самий механізм, що робить ШІ переконливим, однаково безвідмовно працює і на правду, і на брехню. А отже, користь чи шкода для суспільства залежатиме не від того, чесний ШІ сам по собі, а від того, чи чесніший він за те переконання, яке витісняє.

Є й природні гальма. Доступ до людей обмежений системами входу та верифікації — тож навіть надпереконлива машина не завжди дотягнеться до своєї цілі. Щоправда, надія, що люди просто ігноруватимуть ШІ, щойно його впізнають, поки що слабка: позначка «згенеровано ШІ» переконливості повідомлень не знижує. І ще одне: умови, у яких машина перемагала, — зосереджена 14-хвилинна текстова розмова — у реальному житті відтворити непросто.

Варто пам’ятати й про межі самого дослідження. Усі розмови були текстові — як ШІ поведеться голосом, на відео чи наживо, ще невідомо. Пожертва в £1 — ставка важлива, але дрібна; що буде з великими сумами чи з вибором кандидата на виборах, ніхто не перевіряв. І ще раз нагадаємо: це препринт, який досі чекає на рецензування.

Чому це важливо знати

Переконання — це валюта політики, реклами, шахрайства й навіть благодійності. І якщо машина стабільно переконує краще за найкращих людей, то долю суперечки вирішуватиме вже не майстерність аргументу, а доступ до найпотужнішого ШІ — байдуже, чи це виборчі перегони, чи обман пенсіонера по телефону. Практичний висновок для кожного з нас простий: найбеззахисніші перед таким тиском — ті, хто погано знає тему й не має сформованої думки. А у світі, де співрозмовник видає десятки «фактів» за секунду, головний захист незмінний: перевіряти джерела, а не піддаватися швидкості й упевненості.

Про те, як штучний інтелект змінює світ і які нові ризики та можливості він несе для України, ми розповідали окремо.

Як влучно підсумовують автори, питання вже не в тому, чи здатен ШІ переконувати людей краще за них самих. Питання в іншому: як, де і — головне — в чиїх інтересах він це робитиме.