В исследовании представлен APOSM — новый алгоритм активного обучения, предназначенный для оптимизации дизайна малых молекул, что критически важно для разработки лекарственных препаратов. Основная проблема существующих суррогатных моделей заключается в шуме и разреженности данных при скрининге, что снижает точность предсказаний. Авторы предложили использовать попарное сравнение молекул вместо обучения на абсолютных оценах, что обеспечивает более надежный сигнал для отбора активных кандидатов. Методология APOSM объединяет генератор на основе фрагментов, графовую нейронную сеть (GNN) с механизмом передачи сообщений для попарного сравнения и вероятностное ранжирование в рамках пакетного цикла сбора данных. Тестирование на бенчмарке Practical Molecular Optimization и задаче по поиску лигандов GPCR показало, что APOSM значительно превосходит методы Graph-GA и классическую точечную регрессию. Наибольшая эффективность алгоритма наблюдается в сценариях, где калибровка абсолютных оценок наиболее затруднена, что делает его перспективным инструментом для ускорения доклинических исследований.