Исследователи представили PocketBagger — инновационный фреймворк для предсказания «лекарственной доступности» (druggability) белковых карманов, использующий метод обучения на положительно-неразмеченных данных (Positive-Unlabeled learning). Основная проблема традиционных моделей заключается в невозможности точно определить «нелекарственные» карманы, что создает смещение в обучающих выборках. PocketBagger решает эту задачу, используя PU-bagging для обучения на структурах из Protein Data Bank (PDB), где известные лиганды считаются положительными примерами, а все остальные карманы — неразмеченными. При тестировании на классификаторе Random Forest модель продемонстрировала высокий показатель полноты (recall) на уровне 0.804, сохраняя эффективность даже при проверке на целых семействах белков, исключенных из обучения. В ходе бенчмаркинга PocketBagger превзошел ведущие методы глубокого обучения по точности обобщения. Разработанный фреймворк универсален и может быть применен к любой архитектуре нейросетей. Результаты работы и сгенерированные данные уже интегрированы в платформу canSAR.ai, что делает инструмент доступным для масштабируемого использования в сообществе компьютерного дизайна лекарств.