Исследование представляет новый подход к молекулярному докингу — предсказанию конформации связывания малых молекул с белковыми мишенями, что критически важно для открытия новых лекарств. Авторы предлагают фреймворк обучения с подкреплением для тренировки диффузионных моделей непосредственно на недифференцируемых объективах физической валидности. Подход позволяет корректировать модель DiffDock-Pocket для генерации физически корректных поз лигандов с сохранением ключевых белково-лигандных взаимодействий. Результаты показывают существенное увеличение доли генерируемых поз, которые являются физически валидными, при этом не требуется дополнительных вычислений во время инференса. Важнейший результат — улучшение структурной точности: возрастает доля структур с позами, близкими к нативным, особенно для белковых мишеней, отличающихся от данных обучения. Доработанная модель превосходит как классические алгоритмы докинга, так и другие методы машинного обучения на наборе данных PoseBusters. Исследование демонстрирует, что обучение с подкреплением может научить диффузионные модели лучше соблюдать физические ограничения без необходимости постобработки результатов. Это открывает перспективы для более точного предсказания взаимодействия лекарств с белками-мишенями в фармацевтических исследованиях.