Skip to main content

Штучний інтелект здивував математиків на таємній зустрічі в Берклі

У середині травня 2024 року в Берклі відбулася таємна зустріч, на якій провідні математики світу намагалися перевершити штучний інтелект — і були вражені його успіхами, пише Scientific American.

 |  Андрій Миколайчук  | 
Штучний інтелект здивував математиків на таємній зустрічі в Берклі
Штучний інтелект здивував математиків. Авторська ілюстраційна генерація за допомогою Midjourney

У центрі уваги — нова модель OpenAI під назвою o1-mini, здатна розв’язувати задачі, які раніше вважалися під силу лише найкращим умам.

У зустрічі, що проходила 17–18 травня 2024 року, взяли участь 30 математиків з усього світу. Вони мали одну мету — створити задачі, з якими не впорається модель великої мовної архітектури (LLM), натренована на математичних міркуваннях. Результати виявилися несподівано приголомшливими: модель o1-mini змогла знайти правильні відповіді на задачі, які спеціально були задумані як «непрохідні» для ШІ.

Нове покоління ШІ-моделей

Модель o1-mini — це полегшений, але спеціалізований варіант LLM нового покоління, який OpenAI тренувала з акцентом на глибоке логічне міркування. Схожими можливостями володіє й еквівалент від Google — Gemini 2.5 Flash. На відміну від попередніх LLM, які керували ChatGPT, o1-mini та її аналоги — це більш легкі, гнучкі моделі, натреновані на спеціалізованих наборах даних із посиленим навчанням від людей. Такий підхід дозволяє чат-боту значно глибше занурюватися в складні математичні проблеми.

Проєкт FrontierMath: виклик для ШІ

Для оцінки можливостей o1-mini було створено тестовий проєкт FrontierMath, організований аналітичним підрозділом Epoch AI. Команда під керівництвом математика Елліота Глейзера зібрала понад 300 задач різного рівня складності — від студентських до відкритих дослідницьких питань, розв’язання яких ще не було опубліковано.

Звичайні LLM могли розв’язувати менш ніж 2% таких задач, тоді як o1-mini до квітня 2025 року продемонструвала результат у понад 20%. Саме тому Epoch AI організувала закриту сесію в Берклі, під час якої дослідники мали створити «четвертий рівень» задач — настільки складних, що навіть професійним математикам знадобилися б місяці чи роки на пошук рішення.

Умови були суворими: заборона на використання електронної пошти, тільки зашифрована комунікація через Signal — аби уникнути витоку задач у навчальні корпуси ШІ. Учасники навіть підписали угоду про нерозголошення.

«Зухвала» відповідь моделі

За кожну задачу, яку не змогла розв’язати модель, авторам обіцяли $7500. Але більшість учасників стикнулися з неочікуваним «розчаруванням». Професор Кен Оно з Університету Вірджинії, один з організаторів зустрічі та незалежний консультант Epoch AI, розповів про епізод, що особливо вразив його.

Він подав моделі задачу з теорії чисел, яку вважав відкритою проблемою докторського рівня. Протягом наступних 10 хвилин приголомшений Оно спостерігав, як бот розгортав розв’язання задачі в реальному часі, демонструючи весь процес свого міркування. Модель спочатку опрацювала відповідну літературу, потім створила спрощену «іграшкову» версію задачі, розв’язала її, і лише після цього впоралася з основною проблемою.

Відповідь вона завершила зухвало: «Жодного посилання не потрібно, бо загадкове число обчислила я сама!»

Реакція наукової спільноти

Після цього професор Оно раннім ранком неділі написав у Signal іншим учасникам:

«Я не був готовий до протистояння з таким LLM. Я ніколи не бачив такого типу міркування в моделях. Це те, що робить науковець. Це лякає».

Математик Ян Хуей Хе із London Institute for Mathematical Sciences, один з піонерів у використанні ШІ у математиці, порівняв модель з ідеальним аспірантом:

«Це саме те, що мав би робити дуже, дуже добрий аспірант — навіть більше».

Швидкість проти точності

Особливе враження на дослідників справила швидкість o1-mini: задачі, які займають у професійних математиків тижні чи місяці, вона розв’язувала за лічені хвилини. Водночас це викликало тривогу щодо надмірної довіри до впевнених відповідей, які видає модель.

«Є доказ через індукцію, є доказ через протиріччя, а є — доказ через залякування, — пожартував Хе. — Якщо ви говорите щось із достатньою авторитетністю, люди просто лякаються. Думаю, o1-mini опанувала доказ через залякування — вона говорить усе з такою впевненістю».

Майбутнє математики

У підсумку за два дні команді математиків вдалося сформулювати лише 10 задач, які модель не змогла вирішити. Завершальна дискусія торкнулася того, що умовний «п’ятий рівень» задач — ті, що не під силу навіть деяким найкращим математикам — уже не здається фантастикою.

Якщо ШІ навчиться розв’язувати і такі задачі, роль математиків може кардинально змінитися. Вони можуть перейти від безпосереднього розв’язання до постановки питань і взаємодії з ШІ-ботами для відкриття нових математичних істин — подібно до того, як професор працює з аспірантами. Тому Оно прогнозує, що виховання креативності у вищій освіті стане ключовим для збереження математики для майбутніх поколінь.

«Я кажу своїм колегам, що це серйозна помилка — стверджувати, що узагальнений штучний інтелект ніколи не з’явиться, що це просто комп’ютер, — підсумовує професор Оно. — Я не хочу додавати до істерії, але в певному сенсі ці великі мовні моделі вже перевершують більшість наших найкращих аспірантів у світі».

Чому це важливо знати

Розвиток моделей на кшталт o1-mini свідчить про новий етап в історії людського пізнання. Якщо штучний інтелект починає перевершувати людей у фундаментальних розділах математики, це не лише ставить нові виклики перед науковою етикою та академічною доброчесністю, а й кардинально змінює роль людини у процесі відкриття знань.

Для України, яка інвестує у науковий розвиток і освіту, це сигнал: потрібно вже зараз інтегрувати ШІ в навчальні програми, підтримувати фундаментальні дослідження і готуватися до світу, де інтелект — не тільки людський.