белок-лигандные взаимодействия

Новость9514 апр.Обзор

Исследователи представили CROWN — новый специализированный датасет, предназначенный для обучения моделей машинного обучения, предсказывающих взаимодействия белков и лигандов. В отличие от существующих баз данных, таких как PDBBind, которые ограничены в объеме, или PLInder, lacking качества, CROWN использует автоматизированный конвейер предобработки для обеспечения высокой точности структур. Из исходных 649 915 систем после применения строгих фильтров (разрешение кристаллографии, полнота карманов, протонирование при физиологическом pH) было отобрано 153 005 высококачественных комплексов. Ключевой инновацией является этап минимизации энергии с использованием кастомных ограничений, что позволяет устранить структурную неоднородность, возникающую из-за различий в методах рефлексии кристаллографов, не искажая при этом экспериментальную геометрию связывания. Датасет обеспечивает четырехкратное увеличение разнообразия белков и видов по сравнению с PDBBind, при этом фокусируясь на геометрии атомов, а не на смещенных показателях аффинности. CROWN станет фундаментальным ресурсом для обучения генеративных моделей связывания, разработки скоринг-функций и бенчмаркинга методов предсказания взаимодействий.

машинное обучение структурная биология дизайн лекарств белок-лигандные взаимодействия датасеты

bioRxiv — Bioinformatics Оригинал

Новость9512 апр.

В статье представлен DESPOT — новый анизотропный фреймворк на основе знаний (knowledge-based potentials), предназначенный для оценки взаимодействий между белками и лигандами. В отличие от классических изотропных методов, которые учитывают только расстояние, DESPOT моделирует условную вероятность нахождения определенных типов атомов лиганда в дискретных пространственных позициях вокруг атомов белка. Это позволяет учитывать направленные предпочтения (водородные связи, ароматические и галогенные взаимодействия) и стерическое исключение через выделенное состояние «пустоты». Тестирование на бенчмарке CASF-2016 показало, что DESPOT значительно превосходит существующие методы в задачах дискриминации поз и виртуального скрининга (p < 0.0001 для всех факторов обогащения). Исследование также подчеркивает важность минимизации энергии обучающих структур и указывает на проблему переобучения в методах на основе знаний. Данная разработка открывает новые возможности для высокоточного дизайна лекарств на основе структуры (structure-based design) и характеризации сайтов связывания.

дизайн лекарств структурная биология виртуальный скрининг+2

bioRxiv — Bioinformatics Оригинал

белок-лигандные взаимодействия

CROWN: Курируемый репозиторий высокоразрешенных нековалентных взаимодействий

DESPOT: Потенциалы скоринга с учетом направленности взаимодействий