Исследование посвящено оптимизации системы DGRec, которая использует ретроэлементы, генерирующие разнообразие (DGR), для программируемого мутагенеза в бактериях Escherichia coli. Авторы решают две критические проблемы: зависимость эффективности мутагенеза от вторичной структуры dgrRNA и вариативность смещения обратной транскрипции в зависимости от контекста последовательности. В работе представлен новый метод перекодирования нефункциональных шаблонов в высокоэффективные с помощью синонимичных мутаций. Ключевым достижением является разработка модели на базе архитектуры Long Short-Term Memory (LSTM), способной предсказывать профили мутаций DGRec для любой заданной последовательности шаблона. Интеграция LSTM-модели с методом перекодирования позволяет создать комплексный рабочий процесс для персонализированной направленной эволюции. Это дает исследователям возможность точно настраивать мутагенез in vivo под конкретные инженерные задачи, значительно повышая точность создания новых биологических функций.