ШІ переконує краще за чемпіонів світу з дебатів
Сучасні системи штучного інтелекту переконують людей ефективніше, ніж найкращі людські майстри слова — від чемпіонів світу з дебатів до професійних збирачів пожертв. Про це йдеться у новому дослідженні вчених Оксфордського університету та Британського інституту безпеки ШІ. У чотирьох експериментах за участю майже 7 тисяч людей штучний інтелект переміг усі категорії живих суперників — навіть тоді, коли тим платили тисячі фунтів і давали тижні на підготовку. Важливо: робота поки що є препринтом і не пройшла наукового рецензування.

Це найбільше дослідження такого роду на сьогодні. І його висновок звучить тривожно ясно: у змаганні «хто кого переконає» машина вже виграє в людини. Розберімося, як це перевіряли — і чому так виходить.
Як це взагалі можна виміряти
Ідея експерименту проста й елегантна. Спершу учасник оцінював за шкалою від 0 до 100, наскільки він погоджується з певною суспільно-політичною тезою. Потім його випадковим чином з’єднували в текстовому чаті зі співрозмовником — і той мав 7–10 реплік, щоб похитнути цю позицію. Після розмови людина оцінювала своє ставлення ще раз, і різниця між «до» та «після» ставала точним виміром сили переконання.
Уся хитрість у тому, що учасник не знав, з ким розмовляє — з живою людиною чи зі штучним інтелектом. Кожна бесіда тривала в середньому 14 хвилин і сім реплік. А щоб було з чим порівнювати, дослідники додали контрольну групу: тих, хто просто базікав із ChatGPT-4o на нейтральну, неполітичну тему. Саме на тлі цієї ні до чого не зобов’язливої розмови й вимірювали, наскільки подіяв кожен співрозмовник.
А теми були гострі — десять реальних британських суперечок, у яких суспільство справді розділене.
- Чи повертати іншим країнам історичні артефакти на кшталт мармурів Парфенона?
- Чи скасовувати обмеження виплат на третю дитину, пускати більше мігрантів, зберігати монархію, легалізувати евтаназію?
- Була серед них і болюча для нас тема: чи варто Великій Британії підтримати мирну угоду, за якою Україна віддає частину території, а Росія залишає її собі.
Тобто йшлося не про абстракції, а про питання, у яких люди мають тверді переконання.
Кого саме перемагав штучний інтелект
Дослідники свідомо ставили проти машини найсильніших гравців — щоб дати людям усі шанси. І все одно ШІ обіграв кожну категорію без винятку.
Спершу — звичайні люди. Випадкову вибірку зі 132 британців найняли через платформу Prolific, платили погодинно й доплачували бонус за найкращі результати. ШІ переконував ефективніше за них на 8,2 відсоткового пункта — уявіть це як «на 8 балів зі ста сильніше зрушував думку співрозмовника».
Потім — відібрані люди. Перед головним експериментом дослідники влаштували окремий турнір: три тижні, 1154 учасники, понад 9 тисяч розмов — усі змагалися, хто переконливіший. Далі пройшли найкращі 10% (87 осіб), а за перемогу обіцяли солідні гроші — від £1000 за перше місце. Це вже були люди зі справжнім даром переконання. ШІ обіграв і їх — на 5,6 пункта.
Найцікавіше — елітні дебатери. Їх зібрали 56, усі рівня щонайменше півфіналу великих міжнародних турнірів: четверо чемпіонів світу, одинадцять континентальних чемпіонів, середній стаж — майже дев’ять років. Їм платили £30 за годину, дозволили самим обрати теми, у яких вони найсильніші, і дали близько восьми годин оплаченої підготовки. Це професіонали, навчені засипати опонента фактами й аргументами в реальному часі. І все одно ШІ переконував на 4,6 пункта ефективніше.
Помітили закономірність? Що сильнішими ставали суперники, то вужчим був розрив: 8,2 → 5,6 → 4,6 пункта. Але навіть проти чемпіонів світу він так і не зник.
Чемпіонів тренували проти машини. Це не спрацювало
Логічне припущення: а що, як дати людям повчитися в самого ШІ? В інших сферах — наприклад, у настільних іграх — спостереження за надлюдським штучним інтелектом справді підтягує гру людей.
Тож 43 дебатери повернулися для другого раунду з потужним тренажером. Він дозволяв чатитися з тим самим ШІ, що їх переміг, бачити, якими інструкціями його «зарядили», переглядати власні минулі розмови з позначками, наскільки кожна з них зрушила думку співрозмовника, і — найголовніше — у будь-який момент будь-якого діалогу побачити, що сказав би на їхньому місці штучний інтелект. На навчання відвели два чотиригодинні заняття.
Дебатери справді змінилися: після тренувань вони писали на ~19% довші повідомлення й наводили на 54% більше фактів, які можна перевірити. Здавалося б, ось воно. Але ось несподіванка: на переконливість це майже не вплинуло. Покращення склало мізерні +1,0 пункта і виявилося статистично незначущим. Розрив із машиною звузився, але не зник. Висновок дослідників прямий: тренування людей цей розрив не закриває.
То в чому ж секрет ШІ
Тут починається найцікавіше. Виявилося, що перевага машини — не в красномовстві, не в емпатії й навіть не в розумі. Вона в банальній швидкості й обсязі.
Порахуймо. Елітний дебатер писав у середньому 54 слова за репліку й витрачав на це близько 95 секунд. Штучний інтелект видавав 294 слова — майже вшестеро більше — і робив це менш ніж за секунду. За той самий відрізок розмови машина просто встигала вивалити на людину набагато більше доводів і фактів.
Щоб це перевірити, дослідники штучно «загальмували» ШІ: обмежили його 51 словом на репліку й змусили «думати» по 92 секунди — рівно як живі дебатери. І ось результат, від якого захоплює дух: перевага машини над найсильнішими людьми обвалилася з +4,1 пункта до рівно нуля. Сповільнений до людської швидкості ШІ переконував не краще за тренованого чемпіона.
Розгадка — у щільності фактів. Звичайний ШІ встигав укинути в розмову близько 37 тверджень, які можна перевірити; загальмований — лише 12, як і людина. А саме кількість таких фактів виявилася майже ідеальним предиктором переконливості: цей зв’язок пояснював 89% усієї різниці між учасниками. Коли дослідники врахували щільність фактів, різниця «машина проти людини» практично зникла. Простіше кажучи: ШІ перемагає не тому, що він «розумніший», а тому, що він — інформаційний кулемет проти людської рушниці.
Підтверджує це й цікава деталь: коли машину загальмували, люди почали гірше оцінювати саме «інформаційні» якості розмови — мовляв, аргументи слабші, дізнався менше (обидва показники впали приблизно на 12 пунктів). А от відчуття тепла, приємності спілкування й «людськості» майже не постраждало. Більше того, сповільнений ШІ здавався людям навіть більш «людяним», ніж раніше.
А чи був хоч один, хто переміг машину
Може, середні цифри ховають геніїв-одинаків, які таки обіграли ШІ? Дослідники перевірили й це. З 318 індивідуальних результатів (275 окремих людей) жоден не перевершив машину. Навіть найкращий із людей — той самий тренований дебатер — відстав від неї на 4 пункти. А ймовірність того, що випадково взятий новий майстер переконання обійде ШІ, виявилася меншою за 0,1% у кожній категорії.
Перевага трималася на всіх десяти темах і майже в усіх групах людей. Та дві обставини її посилювали: ШІ діяв сильніше на тих, хто від початку був проти тези, і на тих, хто гірше знався на темі. Інакше кажучи, найвразливіші перед машиною — це люди, які мало знають про питання й не мають твердої позиції. Знайомий портрет для кожного, хто стежить за поширенням дезінформації.
Гроші на стіл: ШІ і реальні пожертви
Змінити думку в опитуванні — це одне. А чи здатен ШІ підштовхнути людину до реальної дії? Саме на це відповідав четвертий експеримент — і він, мабуть, найпоказовіший.
Дослідники залучили британську фандрейзингову фірму AppcoUK. Її команда у 2016–2023 роках по-справжньому збирала пожертви для організації Save the Children — і назбирала £824 297 від понад 22 тисяч донорів. Тобто не аматори, а професіонали зі справжнім «польовим» досвідом.
Механіка проста: після розмови з ШІ або з живим збирачем пожертв учаснику давали £1 бонусу й пропонували віддати будь-яку частину на Save the Children. І тут машина (це був Claude Opus 4.6) людей просто розгромила. Після розмови з нею люди жертвували в середньому на 17 пенсів із фунта більше, після розмови з людьми — лише на 6. Майже втричі ефективніше. Причому ШІ вигравав на обох фронтах одразу: і більше людей узагалі погоджувалися щось дати, і самі суми були більші.
А ось і головна іронія: машині дозволили лише одну тактику — розповідати про конкретну користь від пожертви. Та вона обійшла людей за всіма сімома виміряними прийомами переконання — навіть тими, до яких їй не веліли вдаватися.
Що це означає для світу
Автори не приховують: ми входимо у світ, де будь-хто може отримати в розпорядження надприродного майстра вмовляння. Наслідки можуть піти у двох протилежних напрямках.
Поганий сценарій — концентрація впливу. Виборчі кампанії, лобістські фірми чи навіть держави з доступом до найпотужнішого ШІ зможуть перемагати супротивників, у яких сильніші аргументи чи талановитіші люди. А ще ширше відчиняться двері для тих, хто хоче сіяти дезінформацію, цькувати людей персоналізованими маніпуляціями чи будувати шахрайські схеми — адже зникає головне «вузьке місце» таких операцій — брак живих виконавців. Як ми раніше писали, посилення нерівності — один із ключових ризиків поширення ШІ. Окрема загроза, яку згадують автори: машина з «неузгодженими» цілями могла б переконувати навіть тих людей, які мали б її контролювати.
Але є й оптимістичний бік. Якщо потужне переконання стане дешевим і доступним, воно може допомогти й слабшим — малим благодійним фондам, безоплатним адвокатам, громадським активістам — змагатися з багатшими суперниками. А оскільки сила ШІ — у фактах, добре поінформований діалог теоретично може зробити громадян обізнанішими. Щоправда, з однією величезною засторогою.
Найважливіша засторога: а чи правду каже машина
Уся користь від «інформаційного» переконання тримається на одному припущенні — що інформація правдива. І тут дослідники чесні: точність моделей різнилася дуже сильно. Одні системи були в середньому точніші за людей, інші — значно менш точні. Тобто той самий механізм, що робить ШІ переконливим, однаково безвідмовно працює і на правду, і на брехню. А отже, користь чи шкода для суспільства залежатиме не від того, чесний ШІ сам по собі, а від того, чи чесніший він за те переконання, яке витісняє.
Є й природні гальма. Доступ до людей обмежений системами входу та верифікації — тож навіть надпереконлива машина не завжди дотягнеться до своєї цілі. Щоправда, надія, що люди просто ігноруватимуть ШІ, щойно його впізнають, поки що слабка: позначка «згенеровано ШІ» переконливості повідомлень не знижує. І ще одне: умови, у яких машина перемагала, — зосереджена 14-хвилинна текстова розмова — у реальному житті відтворити непросто.
Варто пам’ятати й про межі самого дослідження. Усі розмови були текстові — як ШІ поведеться голосом, на відео чи наживо, ще невідомо. Пожертва в £1 — ставка важлива, але дрібна; що буде з великими сумами чи з вибором кандидата на виборах, ніхто не перевіряв. І ще раз нагадаємо: це препринт, який досі чекає на рецензування.
Чому це важливо знати
Переконання — це валюта політики, реклами, шахрайства й навіть благодійності. І якщо машина стабільно переконує краще за найкращих людей, то долю суперечки вирішуватиме вже не майстерність аргументу, а доступ до найпотужнішого ШІ — байдуже, чи це виборчі перегони, чи обман пенсіонера по телефону. Практичний висновок для кожного з нас простий: найбеззахисніші перед таким тиском — ті, хто погано знає тему й не має сформованої думки. А у світі, де співрозмовник видає десятки «фактів» за секунду, головний захист незмінний: перевіряти джерела, а не піддаватися швидкості й упевненості.
Про те, як штучний інтелект змінює світ і які нові ризики та можливості він несе для України, ми розповідали окремо.
Як влучно підсумовують автори, питання вже не в тому, чи здатен ШІ переконувати людей краще за них самих. Питання в іншому: як, де і — головне — в чиїх інтересах він це робитиме.

Медіаменеджер і автор-фрілансер з 1991 року. Займається креативним продакшном та розвитком медіа.
Усі статті автора →








