Исследование Guo et al. представляет новый подход к генерации молекул с использованием языковой модели на базе архитектуры Mamba. Авторы демонстрируют, что комбинация аугментации данных и техники experience replay (переживания опыта) позволяет эффективно генерировать оптимизированные по свойствам малые молекулы. Методология основана на применении memory manipulation — механизмов управления памятью в нейросетях для сохранения и повторного использования ранее сгенерированных молекул. Исследование решает проблему sample efficiency — необходимости в большом количестве данных для обучения генеративных моделей в фармацевтике. Подход позволяет сократить количество необходимых примеров для обучения при сохранении качества сгенерированных молекул. Это имеет прямое значение для ускорения drug discovery, где генерация новых лекарственных кандидатов является ресурсоёмким процессом. Работа опубликована в Nature Machine Intelligence, что подтверждает научную значимость подхода для области ИИ в медицине.