Skip to main content

«Кінець науки»: ШІ вперше переміг вчених з Google та OpenAI

Штучний інтелект вперше перевершив людей-експертів у наукових дослідженнях — система Locus обійшла вчених з OpenAI, Google DeepMind та Anthropic на тестах із ШІ-розробки. Одночасно журнал Science опублікував статтю «Після науки», де дослідники попереджають: здатність контролювати природу за допомогою ШІ починає випереджати наше розуміння самої природи. Дві Нобелівські премії за роботи зі штучним інтелектом та сотні мільярдів доларів інвестицій — наука на порозі трансформації. Про це пишуть Science та Intology AI.

 |  Андрій Миколайчук  | 
«Кінець науки»: ШІ вперше переміг вчених з Google та OpenAI
Авторська ілюстративна генерація за допомогою Midjourney

Машина обійшла найкращих дослідників

Стартап Intology AI із Сан-Франциско представив систему Locus, яка стала першою у світі, що перевершила людей-експертів на бенчмарку RE-Bench — тесті для оцінки здатності виконувати реальні завдання з розробки штучного інтелекту.

Серед людей-учасників тесту — дослідники з провідних лабораторій OpenAI, Google DeepMind та Anthropic, а також PhD-студенти зі Стенфорда та Університету Карнегі-Меллона. За 64 години безперервної роботи Locus набрав 1.30 бала проти 1.27 у людей. Різниця стає ще помітнішою на коротших дистанціях: за 2 години машина показала результат 0.34 проти 0.07 у людей, за 8 годин — 0.70 проти 0.65.

Головна перевага Locus — здатність підтримувати прогрес протягом днів, тоді як інші ШІ-системи «вигорають» за кілька годин. Наприклад, Claude Code від Anthropic досягає плато на позначці 0.64 вже після двох годин роботи і далі не покращується.

Що вміє «штучний вчений»

Locus — це не перша розробка Intology. Раніше компанія створила Zochi — систему, яка стала першим «штучним вченим», що пройшла наукове рецензування та опублікувала статтю на конференції ACL 2025, одній з найпрестижніших у галузі комп’ютерної лінгвістики.

Нова система демонструє вражаючі результати в оптимізації комп’ютерних обчислень. На тестах KernelBench Locus прискорює виконання операцій від 1.5 до 100 разів порівняно зі стандартними методами. На змаганнях з машинного навчання MLE-Bench система здобуває медалі у 77% випадків — попередній рекорд належав Microsoft із показником 68%.

Розробники бачать майбутнє, де такі системи працюватимуть тижнями або місяцями над найскладнішими науковими проблемами. Вже зараз Locus використовується всередині компанії для досліджень, і команда обіцяє незабаром поділитися «новими науковими відкриттями».

«Епоха постнауки»

Паралельно з анонсом Locus журнал Science опублікував програмну статтю «Після науки» дослідників Джеймса Еванса та Імона Дуеде. Автори описують парадоксальну ситуацію: людство вперше в історії отримує здатність контролювати природу, не розуміючи, як саме цей контроль працює.

Традиційно наука поєднувала розуміння та контроль. Вчені спочатку пояснювали явище, а потім використовували це знання для практичних цілей. Зараз ситуація змінюється: ШІ-системи передбачають структуру білків або керують термоядерними реакціями, але їхня внутрішня логіка залишається «чорною скринькою» навіть для творців.

У 2024 році дві Нобелівські премії присудили за роботи у сфері ШІ: з фізики — Джону Гопфілду та Джеффрі Гінтону за створення штучних нейронних мереж, з хімії — Девіду Бейкеру, Демісу Гассабісу та Джону Джамперу за ШІ-систему AlphaFold, яка передбачає структуру білків. Інвестиції в галузь сягнули сотень мільярдів доларів. Наука дедалі швидше автоматизує дослідницький процес.

Ризики нової ери

Автори статті у Science попереджають про кілька загроз.

Перша — згасання наукової цікавості. Якщо машини робитимуть відкриття без участі людей, вчені можуть втратити мотивацію шукати нові питання.

Друга — монокультура досліджень. Традиційна наука тримається на різноманітності методів і підходів. Проте висока ефективність ШІ може витіснити альтернативи. Якщо кілька домінантних архітектур на кшталт трансформерів «вб’ють» конкурентів — зникне різноманітність перспектив, необхідна для майбутніх проривів.

Третя — «галюцинації» штучного інтелекту. Моделі часто генерують, на перший погляд, переконливі, але при цьому хибні результати. Якщо потік низькоякісних знахідок перевищить здатність їх перевіряти, наука потоне в сумнівних «відкриттях».

Автори пропонують рішення: автоматизувати контроль якості, закладати «цікавість» у самі алгоритми та свідомо підтримувати різноманітність наукових підходів.

Що буде далі

Обидві публікації малюють картину науки, що швидко змінюється. Locus демонструє, що машини вже здатні перевершувати людей у конкретних дослідницьких завданнях. Стаття у Science попереджає, що це лише початок трансформації, яка змінить саму природу наукового пізнання.

Розробники Intology визнають обмеження: Locus працює в межах існуючих парадигм машинного навчання і поки не здатен «переосмислювати» самі проблеми. Проте компанія очікує, що система продовжуватиме масштабуватися до складніших і триваліших завдань.

Дослідники зі Science цитують фантаста Теда Чана, який 25 років тому описав майбутнє, де вчені перестають робити оригінальні відкриття і переходять до «герменевтики» — інтерпретації результатів, створених машинами. Схоже, цей сценарій стає реальністю швидше, ніж очікувалося.

Чому це важливо знати

Результати Locus та попередження дослідників Science сигналізують про фундаментальний зсув у науці. Штучний інтелект переходить від допоміжного інструменту до самостійного дослідника, здатного перевершувати людей. Це відкриває нові можливості для прискорення відкриттів, але водночас ставить питання про роль людини в науці майбутнього.

Проаналізувати із ШІ: