Исследователи представили mRNA-GPT — инновационную генеративную модель, предназначенную для сквозного проектирования полноразмерных последовательностей мРНК. В отличие от традиционных методов, оптимизирующих отдельные участки, mRNA-GPT осуществляет совместную оптимизацию трех ключевых регионов: 5' UTR, CDS (кодирующая последовательность) и 3' UTR, что позволяет учитывать долгосрочные зависимости и регуляторные взаимодействия между ними. Модель прошла предварительное обучение на колоссальном массиве данных из 30 миллионов естественных последовательностей мРНК различных организмов. Для достижения целевых показателей, таких как период полураспада и эффективность трансляции, авторы применили обучение с подкреплением (Reinforcement Learning) с использованием алгоритма Proximal Policy Optimization (PPO). mRNA-GPT поддерживает гибкие режимы генерации, позволяя создавать как отдельные регионы, так и полноценные последовательности с заданными свойствами. Результаты тестирования показали превосходство модели над современными аналогами (SOTA) в задачах оптимизации стабильности 3' UTR и повышения скорости трансляции CDS, обеспечивая достижение Парето-оптимальных решений при многокритериальной оптимизации.