• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Исследователи НИУ ВШЭ научили нейросеть точнее определять взаимодействия между белками

Исследователи НИУ ВШЭ научили нейросеть точнее определять взаимодействия между белками

© iStock

Ученые Института искусственного интеллекта и цифровых наук (Института ИИиЦН) факультета компьютерных наук НИУ ВШЭ разработали модель, которая с точностью до 95% предсказывает, будут ли белки взаимодействовать друг с другом. GSMFormer-PPI использует три типа данных о белке, в том числе и о его поверхности, и анализирует связи между ними, в отличие от предыдущих моделей, где данные просто объединялись. Разработка может ускорить поиск молекулярных механизмов болезней, биомаркеров и потенциальных мишеней для лекарств. Работа опубликована в журнале Scientific Reports.

Почти все процессы в клетке зависят от взаимодействия белков внутри нее. С их помощью клетка передает сигналы, запускает и регулирует химические реакции, образует молекулярные комплексы, необходимые для ее работы. И если такие взаимодействия нарушаются и клетка работает неправильно, это может приводить к заболеваниям.

Поэтому для изучения механизма болезней и поиска мишеней для лечения ученым важно понимать, какие белки могут взаимодействовать друг с другом, а какие нет. Выяснять это экспериментально трудно: если в исследовании рассматриваются десятки или сотни белков, число возможных пар оказывается слишком большим для проверки. Из-за этого биологи используют методы машинного обучения, предсказывающие такие связи по структуре и свойствам молекул. 

Исследователи НИУ ВШЭ разработали систему GSMFormer-PPI, которая учитывает три типа данных о каждом из белков в предполагаемой паре: аминокислотную последовательность, трехмерную структуру и свойства молекулярной поверхности.  Для их обработки авторы использовали существующие модели, которые переводят эти данные в числовые представления. Аминокислотную последовательность — порядок цепочки аминокислот, из которой построен белок, — анализирует белковая языковая модель. Трехмерная структура белка представляется как граф, где аминокислоты становятся вершинами, а их пространственные контакты — связями.  Такое описание обрабатывает графовая нейронная сеть. Также с помощью отдельного алгоритма учитывались свойства поверхности белка — форма и физико-химические характеристики участков, через которые белки распознают друг друга.

Затем эти числовые представления о белках поступали в разработанный авторами трансформерный модуль — нейросеть, которая совместно анализирует разные типы данных о белке. Если в работах других исследователей признаки часто просто объединялись в один вектор, то здесь модель не складывает их механически, а выявляет связи между ними. 

Попцова Мария

«При взаимодействии белков особенно важна их поверхность: именно через нее молекулы распознают друг друга и на ней сосредоточены физико-химические свойства, от которых зависит связывание. В нашей модели мы попытались учесть эту информацию вместе с последовательностью и трехмерной структурой белка, а затем не просто объединить признаки, а дать алгоритму возможность анализировать связи между ними. Именно это и позволило точнее предсказывать белок-белковые взаимодействия», — комментирует один из авторов статьи, директор Центра биомедицинских исследований и технологий Института ИИиЦН ФКН НИУ ВШЭ Мария Попцова.

Схема работы модели GSMFormer-PPI. На панели A показаны разные типы представлений белка, которые использует модель: последовательностно-структурные и поверхностные. На панели B показано, как они приводятся к общей размерности, анализируются трансформером и затем используются для итогового предсказания взаимодействия. 
© Arteaga, D., Chervov, N. & Poptsova, M. Multimodal graph, surface, and language-based model for protein protein interaction prediction. Sci Rep 16, 4772 (2026).

Чтобы проверить, насколько хорошо работает новая модель, исследователи протестировали ее на наборе данных PINDER — крупной базе известных белковых взаимодействий.  В экспериментах GSMFormer-PPI показала точность 95,7% и превзошла популярные графовые модели, например GCN и GAT. Также исследователи провели тест с более простым вариантом GSMFormer-PPI — без модуля, который анализирует связи между разными типами данных. Эта версия работала хуже, что доказывает: дело не только в самих данных о белке, но и в том, как именно модель их сопоставляет.

Дополнительные тесты показали, что для точного прогноза важны все три типа данных: последовательность, пространственная структура и свойства поверхности белка. Когда исследователи поочередно убирали один из компонентов, качество предсказания снижалось. Иными словами, модель работает лучше именно потому, что рассматривает белок сразу на нескольких уровнях. В перспективе такие системы могут помочь быстрее отбирать пары белков при изучении механизмов болезней и поиске мишеней для лекарств.

Работа выполнена при поддержке гранта для исследовательских центров в области искусственного интеллекта Министерства экономического развития РФ, реализуемого на базе НИУ ВШЭ.

Вам также может быть интересно:

Технодень МИЭМ ВШЭ: праздник технологий и старт новых партнерств

В атриуме на Покровке прошел масштабный фестиваль технологических решений инженерных проектных команд Московского института электроники и математики ВШЭ, где были представлены лучшие студенческие разработки и совместные мастерские МИЭМ и партнеров. Кроме того, в рамках события прошел круглый стол, посвященный вопросам инженерного образования, и были подписаны новые соглашения о сотрудничестве с компаниями – технологическими лидерами в своих отраслях деятельности.

Высшая школа экономики и «Ростелеком» поддержат ИИ-стартапы для госсектора

НИУ ВШЭ и «Ростелеком» подписали на ПМЭФ-2026 соглашение о сотрудничестве в рамках реализации акселератора ИИ-решений для государственного сектора. Совместная работа позволит объединить технологическую экспертизу крупнейшего цифрового партнера государства и академический потенциал ведущего исследовательского университета страны.

НИУ ВШЭ второй год подряд на первом месте рейтинга вузов Альянса в сфере ИИ

Альянс в сфере искусственного интеллекта опубликовал рейтинг российских высших учебных заведений по качеству подготовки кадров для работы с ИИ. Высшая школа экономики второй год занимает первую строчку рейтинга, оставаясь единственным университетом в категории A++.

Институт искусственного интеллекта и цифровых наук ВШЭ представил платформу предиктивной аналитики для бизнеса

Институт искусственного интеллекта и цифровых наук ФКН ВШЭ разработал Predict Core — унифицированное алгоритмическое ядро предиктивной аналитики. Платформа переводит работу с данными из режима отчетности постфактум в управленческую привычку с прогнозами, интерпретацией и понятным следом, показывающим, как была получена эта цифра.

НИУ ВШЭ и МТС договорились об обмене ИИ-компетенциями при подготовке инженерных кадров для телекома

НИУ ВШЭ и ПАО «МТС» заключили соглашение о стратегическом партнерстве, которое предполагает подготовку кадров с ИИ-компетенциями для телекоммуникационной отрасли по программам высшего и дополнительного профессионального образования. Соглашение направлено на повышение качества образования, обмен экспертизой и компетенциями при подготовке инженеров, владеющих технологиями ИИ и машинного обучения.

Студенты ФКН НИУ ВШЭ разработали ИИ-решения для прогнозирования и маркетинга

24 мая в Вышке состоялись защиты и церемония награждения хакатона по машинному обучению для ретейла, организованного MAGNIT TECH и факультетом компьютерных наук НИУ ВШЭ. В течение четырех дней команды работали над индустриальными кейсами технологичного драйвера крупнейшего ретейлера страны — компании «Магнит». Участники анализировали данные, обучали модели, проверяли гипотезы и защищали свои решения перед экспертами компании, чтобы в итоге не только добиться высокого качества моделей, но и предложить подходы для использования в реальном бизнесе.

Образовательный марафон для учителей: как ФКН ВШЭ выстраивает диалог с педагогами

В рамках фестиваля «Дни компьютерных наук» ФКН НИУ ВШЭ на базе учебного центра «Вороново» прошел первый Образовательный марафон для учителей информатики и математики. Всего в мероприятии приняли участие 76 педагогов, представлявших разные регионы России, а также участники из Витебска (Беларусь) и Вьентьяна (Лаос).

Точка входа в ИИ: на ЦИПР обсудили влияние технологий на будущее

Участники ЦИПР-2026 обсудили, как офисные приложения могут стать точкой массового доступа к ИИ и снизить барьеры использования. Эксперты сошлись во мнении, что будущее — за адаптивными моделями и экосистемным подходом к корпоративным данным. В экспертных дискуссиях приняли участие представители НИУ ВШЭ.

«Входить в сферу робототехники сейчас — значит расти вместе с направлением»

Беспилотный транспорт, роботы-курьеры и умные колонки стремительно становятся частью нашей жизни. В 2026 году факультет компьютерных наук НИУ ВШЭ открывает новый бакалавриат«Проектирование интеллектуальных робототехнических систем» (ПИРС). Здесь будут готовить специалистов на стыке ИТ, искусственного интеллекта и робототехники. О том, как устроена учеба и почему выпускников программы «точно возьмут в будущее», рассказывает академический руководитель ПИРС Вадим Моргачёв. 

Технодень МИЭМ на Покровке: совместно исследуем инженерный код Вышки

26 мая в центральном атриуме корпуса на Покровском бульваре, 11, пройдет традиционный масштабный фестиваль инженерных разработок проектных команд Московского института электроники и математики (МИЭМ) ВШЭ. В программе — презентации лучших студенческих технологических проектов, стенды дружественных компаний и совместных мастерских, лекторий с участием практикующих инженеров, круглый стол о развитии инженерного образования и представление магистерских программ МИЭМ.