Нейромережа від DeepMind вирішила задачу, над якою біологи билися пів століття. Це допомогло б перемогти коронавірус значно раніше, а тепер стане в нагоді проти майбутніх пандемій — пояснюємо коротко

Автор:
Сергій Пивоваров
Редактор:
Євген Спірін
Дата:
Нейромережа від DeepMind вирішила задачу, над якою біологи билися пів століття. Це допомогло б перемогти коронавірус значно раніше, а тепер стане в нагоді проти майбутніх пандемій — пояснюємо коротко

Karolina Uskakovych / «Бабель»

Дослідники компанії DeepMind, що належить Google, за допомогою системи штучного інтелекту AlphaFold змогли передбачити точну структуру білка при згортанні. Це дуже складна задача, яку вчені не могли вирішити останні 50 років. На розшифрування структури білка йшли десятиліття роботи в лабораторіях на складному і коштовному обладнанні. А нейромережі для цього було достатньо кілька годин. Таке відкриття допоможе зрозуміти, як віруси поширюються і впливають на організм людини, а отже і швидше створювати ліки проти них. «Бабель» коротко розповідає, наскільки важливе це відкриття, чому вчені довго не могли досягти прориву і як це вдалося DeepMind.

Білки — важлива складова кожної клітини живих організмів. У організмі людини вони виконують безліч функцій. Відповідають за роботу мʼязів, ріст та відновлення тканин та волосся. Білок гемоглобін транспортує кисень через кров, а білок інсулін контролює рівень цукру в крові. Антитіла, які виділяють клітини імунної системи для боротьби з вірусами — це теж білки.

Білки складаються з амінокислот, які шикуються в ланцюжок, а потім згортаються в складні тривимірні структури. Цей процес називається фолдинг або укладання білка. І від того, в яку форму зрештою згорнеться білок, залежать його властивості та функції в організмі. На початку 1970-х нобелівський лауреат біохімік Крістіан Анфінсен припустив, що послідовність амінокислот білка має повністю визначати його кінцеву структуру.

На практиці все виявилося не так просто. Визначити амінокислотний склад білка — це тільки пів справи. А ось передбачити, в яку структуру складеться білок з певною послідовністю амінокислот, набагато складніше. Усе тому, що кількість способів, якими він може згортатися, є астрономічною.

Проблема передбачення структури білків стала однією з найважливіших задач науки. Десятиліттями для цього застосовували такі лабораторні методи, як рентгенівська кристалографія, ядерний магнітний резонанс або кріоелектронна мікроскопія. Це коштовний, складний і, головне, тривалий процес, на який ідуть місяці і навіть роки. Зрештою на сьогодні вдалося встановити 3D-структури приблизно 170 тисяч білків з близько 200 мільйонів, відомих науці.

DeepMind

Від компʼютерних технологій тут теж допомоги небагато. Розшифрувати математично структуру схожих білків за шаблоном ще можливо. Однак для того, щоб передбачити «з нуля» структуру невідомого білка, особливо з довгою послідовністю амінокислот, обчислювальних спроможностей не вистачає.

Учені організували «білкову олімпіаду», щоб прискорити прогрес. З 1994 року раз на два роки проводиться конкурс CASP — Critical Assessment of Рrotein Structure Prediction (Критична оцінка передбачення структури білків). На ній результати команд, які використовують компʼютерні алгоритми, порівнюють з результатами, отриманими «класичними» лабораторними методами структурної біології.

Довгий час величина збігу компʼютерних і лабораторних результатів Global Distance Test (GDT) не піднімалася вище 20—40 балів зі 100 можливих.

На допомогу прийшов штучний інтелект. Британська компанія DeepMind уже десять років займається дослідженнями в галузі штучного інтелекту. Її програми вже успішно змагалися з людьми у шахах і го, а також у компʼютерних іграх Starcraft II і Atari.

У 2018 році DeepMind представила свою нейромережу AlphaFold для участі в конкурсі CASP. І вже тоді перевершила інші компʼютерні проєкти, показавши результат близько 60 балів GDT. Перед конкурсом 2020 року дослідники «згодували» AlphaFold дані 170 тисяч розшифрованих структур білків. На навчання пішло кілька тижнів роботи на еквіваленті від 100 до 200 графічних процесорів — за сучасними мірками це середня обчислювальна потужність.

Порівняння двох 3D-структур білків: зелена — експериментально підтверджена структура, синя — спрогнозована програмою AlphaFold.

DeepMind

За підсумками конкурсу виявилося, що нова версія AlphaFold перевершує за своєю точністю не тільки інші компʼютерні програми, а й лабораторні вимірювання. У середньому за всі проаналізовані білки нейромережа DeepMind отримала 92,5 бала зі 100. Для порівняння, 90 балів отримували найкращі лабораторні методи. Навіть прогнозування структури найскладніших білків AlphaFold вдалося на 87 балів. А на розрахунки у нейромережі йде від кількох годин до кількох хвилин.

Це найважливіший прорив для медицини і біології. Моделювання згортання білків — ключове завдання для дослідження того, як хвороби поширюються і впливають на організм людини. Розуміння цього процесу може дозволити блокувати поширення інфекції в організмі або виправляти помилки у згортанні, які призводять до різних розладів на кшталт хвороби Альцгеймера. Це може допомогти набагато швидше розробляти нові ліки і зрозуміти, як краще застосовувати вже існуючі препарати для лікування нових вірусів і хвороб.

Модель структури білка коронавірусу.

DeepMind

Нейромережа вже допомогла передбачити кілька найбільш «небезпечних» білкових структур вірусу SARS-CoV-2. Це білок ORF3a, який допомагає змінити середовище всередині зараженої клітини і запускає запалення — один з найнебезпечніших симптомів COVID-19. А також ORF8 — цей білок блокує сигнали, які інфікована клітина посилає імунній системі. Крім того, він блокує специфічні внутрішньоклітинні противірусні білки, на які націлені віруси поліомієліту і грипу.

Якби цей прорив стався хоча б на рік раніше, це допомогло б створити вакцину від коронавірусу значно швидше. Нині ж дослідники вважають, що нейромережа AlphaFold допоможе у боротьбі з майбутніми пандеміями.