Білки — важлива складова кожної клітини живих організмів. У організмі людини вони виконують безліч функцій. Відповідають за роботу мʼязів, ріст та відновлення тканин та волосся. Білок гемоглобін транспортує кисень через кров, а білок інсулін контролює рівень цукру в крові. Антитіла, які виділяють клітини імунної системи для боротьби з вірусами — це теж білки.
Білки складаються з амінокислот, які шикуються в ланцюжок, а потім згортаються в складні тривимірні структури. Цей процес називається фолдинг або укладання білка. І від того, в яку форму зрештою згорнеться білок, залежать його властивості та функції в організмі. На початку 1970-х нобелівський лауреат біохімік Крістіан Анфінсен припустив, що послідовність амінокислот білка має повністю визначати його кінцеву структуру.
На практиці все виявилося не так просто. Визначити амінокислотний склад білка — це тільки пів справи. А ось передбачити, в яку структуру складеться білок з певною послідовністю амінокислот, набагато складніше. Усе тому, що кількість способів, якими він може згортатися, є астрономічною.
Проблема передбачення структури білків стала однією з найважливіших задач науки. Десятиліттями для цього застосовували такі лабораторні методи, як рентгенівська кристалографія, ядерний магнітний резонанс або кріоелектронна мікроскопія. Це коштовний, складний і, головне, тривалий процес, на який ідуть місяці і навіть роки. Зрештою на сьогодні вдалося встановити 3D-структури приблизно 170 тисяч білків з близько 200 мільйонів, відомих науці.
Від компʼютерних технологій тут теж допомоги небагато. Розшифрувати математично структуру схожих білків за шаблоном ще можливо. Однак для того, щоб передбачити «з нуля» структуру невідомого білка, особливо з довгою послідовністю амінокислот, обчислювальних спроможностей не вистачає.
Учені організували «білкову олімпіаду», щоб прискорити прогрес. З 1994 року раз на два роки проводиться конкурс CASP — Critical Assessment of Рrotein Structure Prediction (Критична оцінка передбачення структури білків). На ній результати команд, які використовують компʼютерні алгоритми, порівнюють з результатами, отриманими «класичними» лабораторними методами структурної біології.
Довгий час величина збігу компʼютерних і лабораторних результатів Global Distance Test (GDT) не піднімалася вище 20—40 балів зі 100 можливих.
На допомогу прийшов штучний інтелект. Британська компанія DeepMind уже десять років займається дослідженнями в галузі штучного інтелекту. Її програми вже успішно змагалися з людьми у шахах і го, а також у компʼютерних іграх Starcraft II і Atari.
У 2018 році DeepMind представила свою нейромережу AlphaFold для участі в конкурсі CASP. І вже тоді перевершила інші компʼютерні проєкти, показавши результат близько 60 балів GDT. Перед конкурсом 2020 року дослідники «згодували» AlphaFold дані 170 тисяч розшифрованих структур білків. На навчання пішло кілька тижнів роботи на еквіваленті від 100 до 200 графічних процесорів — за сучасними мірками це середня обчислювальна потужність.
За підсумками конкурсу виявилося, що нова версія AlphaFold перевершує за своєю точністю не тільки інші компʼютерні програми, а й лабораторні вимірювання. У середньому за всі проаналізовані білки нейромережа DeepMind отримала 92,5 бала зі 100. Для порівняння, 90 балів отримували найкращі лабораторні методи. Навіть прогнозування структури найскладніших білків AlphaFold вдалося на 87 балів. А на розрахунки у нейромережі йде від кількох годин до кількох хвилин.
Це найважливіший прорив для медицини і біології. Моделювання згортання білків — ключове завдання для дослідження того, як хвороби поширюються і впливають на організм людини. Розуміння цього процесу може дозволити блокувати поширення інфекції в організмі або виправляти помилки у згортанні, які призводять до різних розладів на кшталт хвороби Альцгеймера. Це може допомогти набагато швидше розробляти нові ліки і зрозуміти, як краще застосовувати вже існуючі препарати для лікування нових вірусів і хвороб.
Нейромережа вже допомогла передбачити кілька найбільш «небезпечних» білкових структур вірусу SARS-CoV-2. Це білок ORF3a, який допомагає змінити середовище всередині зараженої клітини і запускає запалення — один з найнебезпечніших симптомів COVID-19. А також ORF8 — цей білок блокує сигнали, які інфікована клітина посилає імунній системі. Крім того, він блокує специфічні внутрішньоклітинні противірусні білки, на які націлені віруси поліомієліту і грипу.
Якби цей прорив стався хоча б на рік раніше, це допомогло б створити вакцину від коронавірусу значно швидше. Нині ж дослідники вважають, що нейромережа AlphaFold допоможе у боротьбі з майбутніми пандеміями.