Суди США розійшлися в оцінках «книжкового піратства» ШІ

У США триває юридична боротьба навколо права компаній-розробників штучного інтелекту використовувати захищені авторським правом книги для навчання своїх моделей.

15 Липня 2025 о 11:11 | Андрій Миколайчук | Наука і технології

Суди США розійшлися в оцінках «книжкового піратства» ШІ

Авторська ілюстраційна генерація за допомогою Midjourney

Як пише The Atlantic, нещодавні судові рішення у справах проти Anthropic і Meta продемонстрували принципові розбіжності в підходах американських суддів до концепції «справедливого використання» (fair use).

В обох випадках суди визнали, що навчання моделей на книжках є трансформативним використанням, яке не конкурує безпосередньо з оригінальними творами. Проте ці висновки не означають остаточної перемоги технологічних компаній — і не дають карт-бланш на безконтрольне використання піратських бібліотек.

Справа Anthropic: навчання — законне, збереження бібліотеки — ні

У справі проти Anthropic суддя Вільям Олсап (William Alsup) визнав навчання великих мовних моделей (LLM) на книжках «справедливим використанням». Однак він підкреслив, що збереження «центральної бібліотеки» з понад 7 мільйонами піратських книжок порушує закон. Компанію чекає судовий процес щодо потенційних мільярдних відшкодувань.

Олсап також відхилив претензії авторів щодо конкуренції з боку творів, згенерованих ШІ. На його думку, поява нових текстів — навіть створених на основі навчального корпусу — не порушує авторських прав:

«Скарга авторів нічим не відрізняється від того, якби вони скаржилися, що навчання школярів добре писати призведе до вибуху конкуруючих творів».

Справа Meta: принципово інший підхід

Суддя Вінс Чаббрія (Vince Chhabria), який розглядав справу проти Meta, категорично не погодився з логікою свого колеги. Він назвав аналогію з навчанням дітей «невдалою» та звернув увагу на фундаментальну різницю між людським навчанням і можливостями ШІ:

«ШІ має потенціал експоненційно примножувати творче вираження способом, на який навчання окремих людей не здатне».

Чаббрія наголосив: використання захищених авторським правом творів для створення інструменту, здатного генерувати мільярдні прибутки та завдавати шкоди ринку авторських творів, навряд чи можна вважати «справедливим використанням».

Втім, він відхилив позов проти Meta, оскільки позивачі не довели конкретної шкоди для своїх творів. Суддя зауважив, що відомі автори на кшталт Агати Крісті можуть бути менш уразливими, ніж початківці:

«Хоча книги, згенеровані ШІ, ймовірно, не матимуть великого впливу на ринок творів Агати Крісті, вони цілком можуть завадити наступній Агаті Крісті бути поміченою або продати достатньо книжок, щоб продовжувати писати».

Технічна невизначеність: чи копіюють ШІ книжки дослівно?

Ключова проблема, яку обидва судді недооцінили, — це здатність LLM відтворювати фрагменти навчальних текстів. Аналіз зосередився на вхідних даних, але не на тому, що генерують моделі. Дослідження показують: від 8 до 15% відповідей LLM містять прямі цитати з інтернету, а в деяких випадках відповіді на 100% скопійовані.

Навесні 2025 року дослідження виявило, що модель Llama здатна майже дослівно відтворювати книжки, зокрема «Гаррі Поттер і філософський камінь» та «1984». Це суттєво ускладнює позицію компаній, які стверджують, що їхні моделі не використовують навчальні тексти як базу даних.

Марк Лемлі (Mark Lemley), провідний правовий експерт з питань ШІ та авторського права, який раніше входив до команди захисту Meta, вийшов з неї і публічно розкритикував компанію за «занурення Марка Цукерберга та Facebook у токсичну маскулінність і неонацистське божевілля». Результати дослідження його здивували:

«Тепер можна стверджувати, що модель містить копії деяких із цих книжок».

Ризики для письменників і культури

Майбутні позови можуть стосуватися не лише використання книг під час навчання, а й здатності ШІ відтворювати тексти повністю. Це відкриває новий фронт для письменників, чиї твори можуть бути виведені за запитом користувача без жодної компенсації автору.

Судова боротьба буде дорогою і технічно складною. Дослідження, які доводять «вбудовану пам’ять» LLM, можуть проводити лише спеціалізовані команди — зазвичай самі розробники. Технологічна індустрія має мало стимулів підтримувати або публікувати такі дослідження.

Чому це важливо для України

Ці справи формують майбутнє як технологічної індустрії, так і культури загалом. Якщо американські суди визнають широке навчання LLM на захищених творах «справедливим використанням», це може призвести до масового витіснення людської творчості автоматизованими алгоритмами.

Для України, яка переживає війну і водночас будує свою культурну самостійність, питання справедливої винагороди за творчість і збереження інтелектуальної власності є критичними. Рішення американських судів стануть прецедентом для європейських судів і майбутніх глобальних домовленостей щодо регулювання ШІ.

Усі новини