Исследование представляет инновационный пайплайн на базе машинного обучения, направленный на преодоление главной проблемы современного поиска антибиотиков — создания производных уже известных классов соединений вместо поиска принципиально новых механизмов действия (MoA). Авторы предложили использовать классификатор XGBoost для раннего выявления химической новизны, объединив его с графовыми нейронными сетями (GNN) для прогнозирования антибактериальной активности и токсичности. При тестировании на базе данных Zinc20 методология позволила успешно идентифицировать нетоксичные соединения, которые структурно отличаются от существующих антибиотиков и обладают селективностью к бактериальным мембранам. Однако ключевым открытием стало обнаружение «механистической предвзятости»: модели склонны отдавать приоритет определенным классам соединений из-за несбалансированности обучающих выборок. Исследование показало, что даже усложнение архитектуры нейросетей не решает проблему отсутствия разнообразия в данных. Таким образом, основным препятствием для открытия антибиотиков с принципиально новыми мишенями является дефицит разнообразных, механистически аннотированных наборов данных, а не несовершенство алгоритмов.