ШІ загрожує науковим оглядам — або може їх урятувати
ШІ може як прискорити наукові огляди, так і зруйнувати їх: генерація фейкових статей загрожує довірі до доказової науки, попереджають дослідники.
Штучний інтелект може як прискорити наукові літературні огляди, так і зруйнувати довіру до них — пише Nature. Поширення фейкових статей, створених генеративним штучним інтелектом, стало екзистенційною загрозою для сфери доказового синтезу (evidence synthesis).
Автори статті — Сем А. Рейнолдс, Алек П. Крісті, Лінн В. Дікс, Садік Джаффер, Аніл Мадхавапедді, Ребекка К. Сміт та Вільям Дж. Сазерленд — об’єднали зусилля міждисциплінарної команди. Вони закликають до радикальної трансформації підходу до оглядів: створення баз даних доказів, що постійно оновлюються за допомогою ШІ, але контролюються авторитетними науковими інституціями.
Ескалація проблеми
Золотим стандартом доказового синтезу є систематичний огляд. Він вимагає:
- ретельного документування критеріїв пошуку
- декларування конфліктів інтересів
- залучення кількох рецензентів для зменшення упередженості
Однак навіть ці зусилля вже не встигають за темпом зростання публікацій. Наприклад, огляди Cochrane коштують понад 140 000 доларів США і тривають більше двох років, а кількість наукових статей подвоюється кожні 14 років з 1952 року.
До того ж:
- лише 1% оглядів надають повністю відтворювану стратегію пошуку
- багато систематичних оглядів продовжують цитувати відкликані статті, навіть після офіційного повідомлення про їхнє відкликання
ШІ як виклик і шанс
Автори погоджуються, що ШІ може полегшити первинний відбір публікацій та аналіз повного тексту, а не лише заголовків і анотацій. Але є й ризики.
Генеративний ШІ здатен масово продукувати фейкові рукописи за лічені хвилини — безкоштовно. Це створює нову форму “паперових фабрик” (paper mills), де виготовляють фіктивні статті, авторства і навіть результати досліджень.
У 2024 році стаття, повністю згенерована інструментом AI Scientist (розробка компанії Sakana AI з Токіо), успішно пройшла рецензування для включення у воркшоп на ключовій конференції з ШІ. Рецензенти не виявили, що модель ШІ сформулювала гіпотези, розробила та провела експерименти, проаналізувала результати, створила графіки та написала рукопис.
Приховані масштаби
Дослідження на arXiv оцінює, що щонайменше 10% усіх анотацій PubMed, опублікованих у 2024 році, були написані за допомогою великих мовних моделей (LLM). Це виявлено на основі різкого зростання частоти певних слів, яке збіглося з широким доступом до LLM. З того часу ця частка майже напевно зросла.
Складність полягає в тому, що важко відрізнити випадки, коли LLM використовується як інструмент редагування, від тих, коли він створює повністю фальшиве дослідження. Використання кількох моделей LLM ускладнює виявлення текстових відбитків конкретної моделі.
Як реагує наукова спільнота
Організації Campbell Collaboration та Cochrane вже надають рекомендації щодо виявлення проблемних або відкликаних досліджень. Вони закликають:
- звіряти статті з базою даних Retraction Watch
- використовувати базу CENTRAL, яка позначає відкликані дослідження
- перераховувати всі результати при виявленні відкликаних джерел
- оновлювати або відкликати огляди з редакторською приміткою
Проте ці механізми часто не працюють на практиці. В оцінці систематичних оглядів фармацевтичних сполук відкликані статті продовжували цитуватися в 89% оглядів через рік після повідомлення авторів про відкликання. Це пов’язано з обмеженими ресурсами та відсутністю стимулів у авторів оригінальних оглядів.
Рішення: живі бази даних доказів
Автори пропонують створення мережі постійно оновлюваних баз даних доказів з підтримкою ШІ, які розміщуватимуться в різних установах. Прикладом слугує проєкт Conservation Evidence (Кембриджський університет), який збирає інформацію про ефективність заходів збереження біорізноманіття.
Модель передбачає:
- тематичні бази даних за широкими напрямками
- постійний перегляд та оновлення інформації
- контроль наукової спільноти над вхідними даними
- можливість швидких та надійних індивідуальних оглядів
Такі платформи можуть стати основою для прозорих оглядів, які не втрачають актуальності зі зростанням публікаційного потоку.
Чому це важливо знати
Для української наукової спільноти, яка активно інтегрується в глобальне академічне середовище, достовірність публікацій має вирішальне значення. У час війни дані потрібні для формування ефективних політик — у медицині, відновленні екосистем, освіті. Доступ до перевіреної інформації стає критичним.
Штучний інтелект може бути корисним інструментом, але лише за умови:
- технологічної прозорості
- етичного регулювання
- людського контролю над даними
Україна може долучитися до побудови таких “постійно оновлюваних репозиторіїв доказів”, зокрема у сферах:
- військової медицини та реабілітації
- екологічного моніторингу деокупованих територій
- психологічної підтримки населення
- відновлення інфраструктури на основі доказових практик
Це шанс не лише захиститися від фейкової науки, але й запропонувати світові нові формати наукової довіри в умовах інформаційних викликів.