В статье исследуется критическая проблема машинного обучения в сфере разработки лекарственных препаратов: сложность идентификации новых биоактивных молекул, которые выходят за рамки распределения обучающих данных (Out-of-Distribution, OOD). Авторы представляют новый метрический подход, предназначенный для количественной оценки химического сдвига распределения (chemical distribution shift). Данная методология позволяет объективно оценивать способность молекулярных ML-моделей к обобщению на новых химических пространствах. Внедрение этой метрики позволяет предсказывать, насколько надежно модель будет работать с ранее неизвестными классами соединений. Это имеет решающее значение для ускорения процесса drug discovery, минимизируя ошибки при поиске инновационных терапевтических агентов. Исследование закладывает основу для создания более устойчивых и предсказуемых моделей в вычислительной химии.