Skip to main content

Science News: Штучний інтелект розшифровує невідомі білки — прорив для медицини та біології

ШІ допомагає науковцям розпізнавати невідомі білки — і це може змінити лікування раку, рідкісних хвороб, пише Science News

 |  Андрій Миколайчук  | 
Science News: Штучний інтелект розшифровує невідомі білки — прорив для медицини та біології
Авторська ілюстраційна генерація за допомогою Midjourney

ШІ допомагає науковцям розпізнавати невідомі білки — і це може змінити лікування раку, рідкісних хвороб, пише Science News

Детальний виклад

Штучний інтелект виходить на новий рівень застосування в біології: дослідники повідомляють про створення двох інноваційних AI-інструментів, які дозволяють виявляти та ідентифікувати раніше непомічені білки. Ці проривні системи, InstaNovo (IN) та InstaNovo+ (IN+), здатні розшифровувати так звані “приховані” білки, які досі були майже недоступні для традиційних методів аналізу.

Стаття, опублікована 31 березня в журналі Nature Machine Intelligence, відзначає, що ці AI-інструменти можуть не тільки допомогти в пошуку нових підходів до лікування онкозахворювань, а й пролити світло на механізми рідкісних хвороб або незвичайних біологічних властивостей тварин.

“Це — крок до святого грааля білкових досліджень: масове дешифрування генетичної сутності невивчених білків,” — каже Бенджамін Нілі, хімік і білковий дослідник з Національного інституту стандартів і технологій у США.


У чому суть відкриття?

Білки — це функціональні “робочі конячки” клітин. Хоча ДНК задає генетичний план, саме білки втілюють його у фізичну діяльність. Але в процесі синтезу часто виникають модифікації, обрізки чи навіть повністю нові форми білків — які не відповідають початковому генетичному коду. Саме ці “непередбачені” білки і є найважчими для виявлення.

Традиційні бази даних обмежені — особливо у випадку з “немодельними” організмами. Але завдяки AI-моделям, натренованим на великих білкових базах, зокрема Proteome Tools, вчені можуть аналізувати сигнали мас-спектрометрії та перекладати їх у амінокислотні послідовності, розпізнаючи нові білкові фрагменти.


Як працюють InstaNovo та InstaNovo+

  • InstaNovo (IN) — трансформерна модель, подібна до GPT-4, яка перетворює сигнали мас-спектрометрії (піки й западини білкового “відбитка”) на ймовірні амінокислотні послідовності.
  • InstaNovo+ (IN+) — дифузійна модель, подібна до генераторів зображень, яка поступово очищує дані, отримуючи чітке “зображення” білка.

Обидві моделі вже демонструють перспективні результати у складних задачах. Наприклад, у розшифруванні білків імунної системи людини, які особливо важко аналізувати через їхній малий розмір і склад амінокислот.

IN знаходить приблизно втричі більше кандидатів білкових сегментів, ніж класичний пошук у базі — з 10 000 до понад 35 000.
IN+ показує ще кращий результат — вшестеро більше.
А у поєднанні — дають ще більший приріст точності.


Потенційне застосування в медицині

Аманда Смітерс, хімік з Інституту раку Дана-Фарбер у Бостоні, вже планує використовувати InstaNovo для пошуку білків, пов’язаних з агресивними формами раку, зокрема раку підшлункової залози:

“Цей рак часто викликає стрімку втрату м’язової маси й хронічну втому. Ми не знаємо, чому. Можливо, в цьому винні білки, які утворюють пухлинні клітини, або порушення білкового обміну в інших клітинах,” — зазначає вона.

Інші приклади — розпізнавання рідкісних білків у морських тварин. Наприклад, у скатів, які можуть переходити з солонуватої води до океану завдяки спеціальним білкам у нирках.


Межі технології

Хоча InstaNovo і InstaNovo+ обіцяють революцію, дослідники визнають: на сьогодні рівень помилкових спрацьовувань — близько 5%. Тобто ці результати потребують подальшої перевірки іншими методами.

“AI-інструменти — це не заміна, а доповнення до традиційних методів,” — підкреслює Смітерс.
“Немає універсального інструменту. Але саме такі моделі просувають нас уперед.”

Також поки не існує єдиного стандарту для оцінки ефективності подібних моделей. Вільям Нобл, один із творців іншого AI-декодера білків — Casanovo, вказує, що питання валідності результатів залишається відкритим.


Чому це важливо знати

ШІ-технології швидко змінюють фундаментальну біологію. Раніше проривом стало моделювання структури білків (AlphaFold), а в 2024 році за дизайн білків за допомогою AI була вручена Нобелівська премія. Тепер наступним кроком стає повноцінне розшифрування всього білкового спектру життя — включно з тими, які раніше залишались “невидимими”.

Це означає не лише нові ліки, а й нове розуміння того, як функціонує організм — від імунної відповіді до екстремальних адаптацій тварин. InstaNovo та InstaNovo+ відкривають двері до цієї нової ери.