Як навчити ШІ передбачати майбутнє: експеримент Foresight Forge із GPT-5 показав несподівані результати
Рохіт Крішнан, інженер та економіст із Сан-Франциско, який раніше керував хедж-фондом та працював венчурним капіталістом, провів експеримент з навчання штучного інтелекту прогнозувати майбутні події. Близько 10% населення світу вже використовують ШІ, і майже кожна компанія має співробітників, які його застосовують, зазначає Крішнан у своєму дослідженні, опублікованому 17 вересня 2025 року в блозі Strange Loop Canon.

Рохіт Крішнан, інженер та економіст із Сан-Франциско, який раніше керував хедж-фондом та працював венчурним капіталістом, провів експеримент з навчання штучного інтелекту прогнозувати майбутні події. Близько 10% населення світу вже використовують ШІ, і майже кожна компанія має співробітників, які його застосовують, зазначає Крішнан у своєму дослідженні, опублікованому 17 вересня 2025 року в блозі Strange Loop Canon.
Що зробив Рохіт Крішнан із ШІ-прогнозами?
Інженер та економіст Рохіт Крішнан створив систему Foresight Forge, яка щодня використовує GPT-5 для автоматичного прогнозування новинних подій та навчила модель Varro передбачати заголовки наступного дня через підкріплювальне навчання.
Які результати показав експеримент Varro?
Навіть крихітна модель Qwen3-0.6B з лише 600 мільйонами параметрів навчилася прогнозувати заголовки наступного дня — завдання, яке навіть для людей надскладне через непередбачуваність новинного циклу.
Чому це важливо для розвитку ШІ?
Успіх експерименту з крихітною моделлю доводить: якщо метод працює на 600-мільйонній моделі з обмеженими ресурсами, то на потужніших моделях типу GPT-5 він дасть ще кращі результати через чіткіші сигнали винагороди та глибше розуміння контексту.
Які компанії вже використовують подібні підходи?
Cursor, ШІ IDE, робить щось подібне для своєї моделі автозавершення коду, де вони беруть набагато сильніший сигнал винагороди з того, чи люди приймають або відхиляють пропозиції, оновлюючи нову модель кожні кілька годин.
Що саме зробив Рохіт Крішнан із прогнозуванням новин?
Крішнан створив дві системи для тестування здатності ШІ передбачати майбутнє. Перша — Foresight Forge (назву обрала сама модель) — це повністю автоматизована платформа на базі GPT-5, яка щодня самостійно збирає новини, генерує прогнози з імовірностями та аналізує власні помилки без жодного втручання людини.
Друга система — експериментальна модель Varro, названа на честь римського вченого Марка Теренція Варрона, якого Петрарка називав «третім великим світлом Риму». На відміну від Foresight Forge, Varro працює на крихітній моделі Qwen3-0.6B прямо на ноутбуці дослідника.
«Я спеціально обмежив себе локальними обчисленнями, щоб не витрачати тисячі доларів щотижня на хмарні GPU. Хотів перевірити, чи можна навчити навіть найменшу модель передбачати майбутнє», — пояснює Крішнан.
Як працює навчання ШІ через винагороди від реального світу?
Основна інновація полягає в методології безперервного навчання. Замість одноразового тренування на мільйонах прикладів з минулого, Varro щодня вчиться на свіжих подіях. Алгоритм простий: модель читає сьогоднішні новини → генерує прогнози на завтра → наступного дня перевіряє, що справді сталося → коригує свої параметри на основі помилок.
Для оцінки точності Крішнан не шукав дослівних збігів — це було б нереалістично. Натомість він використовував семантичну подібність: чи передав прогноз суть того, що сталося? Кожен прогноз мав містити п’ять обов’язкових елементів: хто або що (об’єкт), що зміниться (напрямок і масштаб), коли це станеться (часові рамки), чому це відбудеться (рушійні фактори) та як це можна буде перевірити (конкретні індикатори).
Які несподівані результати показав експеримент?
Найбільшою несподіванкою стала здатність крихітної моделі з 600 мільйонами параметрів успішно навчатися прогнозуванню.
«Я не очікував, що така маленька модель зможе сформувати достатньо глибоке розуміння світу для прогнозування подій. Теоретично це не мало б працювати», — визнає Крішнан.
Експеримент виявив ключову закономірність успіху: модель має балансувати між спробами нових підходів (експлорацією) та використанням перевірених стратегій (експлуатацією). Найкраща версія моделі досягла точності прогнозів 64.3%, при цьому майже не видавала порожніх відповідей (лише 1.3%) і мінімально копіювала фрази з навчальних даних (20% проти 70% у попередніх версіях).
Чому прогнозування новин — це надскладне завдання для ШІ?
Це щось надзвичайно складне навіть для людей, тому що це фундаментально змагальне завдання, пояснює Крішнан. На відміну від математичних задач чи програмування, де існують об’єктивні правильні відповіді, прогнозування новинних подій залежить від безлічі непередбачуваних факторів. Проблема ускладнюється тим, що малі моделі погано справляються з роллю “ШІ-судді” для оцінки власних прогнозів. Крішнан спробував використати більші моделі для оцінки, але вважав це “шахрайством”, оскільки вони могли б навчати про світ меншу модель, замість того щоб вона навчалася чисто з навколишнього середовища
Як Cursor використовує подібний підхід для покращення коду?
Паралельно з експериментами Крішнана, компанія Cursor — творці популярного ШІ-редактора коду — впровадила схожий підхід у реальному продукті. Кожен раз, коли програміст приймає або відхиляє пропозицію автозавершення коду від ШІ, система фіксує цей вибір як сигнал для навчання. Результат вражає: Cursor оновлює свою модель кожні кілька годин, постійно адаптуючись до стилю та потреб розробників.
Це критично важливе підтвердження: метод безперервного навчання працює не лише в лабораторних умовах Крішнана, але й у продукті, яким щодня користуються десятки тисяч програмістів по всьому світу. Cursor довів, що ШІ може вчитися в реальному часі на реальних завданнях, а не лише на штучних датасетах.
Що це означає для майбутнього штучного інтелекту?
«Це величезний прорив. Світ наповнений рідкісними, але цінними сигналами зворотного зв’язку — кожен клік, кожне рішення, кожна подія. Тепер ми знаємо, як навчити ШІ використовувати ці сигнали для постійного вдосконалення», — підсумовує Крішнан.
Епоха одноразового навчання на застарілих датасетах закінчується. Починається ера ШІ, які вчаться щосекунди на реальному досвіді.
Дослідник відкриває код Varro для наукової спільноти через платформу Prime Intellect RL Hub — тепер будь-хто зможе експериментувати з безперервним навчанням. «Майбутнє ШІ буде схоже на відеогру», — прогнозує Крішнан. Він має на увазі не розваги, а принцип: як у грі гравець постійно отримує бали за правильні дії та штрафи за помилки, так і ШІ навчатиметься через миттєвий фідбек від реального світу.
Часті питання
Чи можна використати цей метод для інших завдань, крім прогнозування новин?
Так, метод підходить для будь-яких завдань, де можна отримати зворотний зв’язок про якість виконання. Немає причин вважати, що це не масштабуватиметься на виконання більш цікавих речей.
Скільки коштує запуск такої системи?
Крішнан спеціально обмежив себе використанням ноутбука замість потужних серверів, щоб не витрачати тисячі доларів щотижня на обчислювальні потужності.
Які моделі OpenAI зараз доступні для розробників?
GPT-5 доступний всім користувачам, причому підписники Plus отримують більше використання, а підписники Pro отримують доступ до GPT-5 pro, версії з розширеними можливостями міркування.
Чому це важливо знати
Експерименти Крішнана перевертають уявлення про розробку ШІ. Досі вважалося: хочеш кращу модель — бери більше даних, більше серверів, більше грошей. Крішнан довів протилежне: навіть крихітна модель на ноутбуці може ставати розумнішою щодня, якщо правильно організувати її навчання на реальних подіях.
Це критично важливо для сфер, де все змінюється щосекунди. Уявіть ШІ-трейдера, який адаптується до ринкових коливань не за місяці перенавчання, а за години. Або медичну систему, яка миттєво враховує нові симптоми пандемії, не чекаючи оновлення від розробників. Для України це шанс: українські стартапи можуть створювати передові ШІ-продукти без мільйонних інвестицій в сервери. Достатньо розумного алгоритму навчання — і навіть скромна модель обжене гігантів, які досі вірять у формулу «більше даних + більше серверів = кращий ШІ».