мРНК

Новость9521 маяОбзор

Исследователи представили ProtmRNA — инновационный подход к анализу последовательностей мРНК, основанный на методе кросс-модального обучения с переносом знаний. В основе метода лежит использование предобученной белковой языковой модели ESM-2 для обработки последовательностей мРНК, что опирается на фундаментальную биологическую связь между мРНК и аминокислотными цепями. В ходе тестирования на специализированных наборах данных и восьми дополнительных бенчмарках, ProtmRNA продемонстрировала производительность, сопоставимую или превосходящую существующие SOTA-модели (state-of-the-art) для мРНК. При этом ключевым преимуществом является высокая эффективность: модель требует менее половины вычислительных ресурсов, затрачиваемых на стандартное предварительное обучение. Работа доказывает возможность эффективного переноса знаний между различными типами биологических последовательностей, предлагая новый ресурсосберегающий парадигмальный подход для биоинформатики и разработки лекарств. Предварительно обученная модель и наборы данных для регрессии CDS-регионов доступны в открытом доступе.

биоинформатика NLP мРНК белки машинное обучение перенос обучения

bioRxiv — Bioinformatics Оригинал

Новость9513 апр.

Исследователи представили mRNA-GPT — инновационную генеративную модель, предназначенную для сквозного проектирования полноразмерных последовательностей мРНК. В отличие от традиционных методов, оптимизирующих отдельные участки, mRNA-GPT осуществляет совместную оптимизацию трех ключевых регионов: 5' UTR, CDS (кодирующая последовательность) и 3' UTR, что позволяет учитывать долгосрочные зависимости и регуляторные взаимодействия между ними. Модель прошла предварительное обучение на колоссальном массиве данных из 30 миллионов естественных последовательностей мРНК различных организмов. Для достижения целевых показателей, таких как период полураспада и эффективность трансляции, авторы применили обучение с подкреплением (Reinforcement Learning) с использованием алгоритма Proximal Policy Optimization (PPO). mRNA-GPT поддерживает гибкие режимы генерации, позволяя создавать как отдельные регионы, так и полноценные последовательности с заданными свойствами. Результаты тестирования показали превосходство модели над современными аналогами (SOTA) в задачах оптимизации стабильности 3' UTR и повышения скорости трансляции CDS, обеспечивая достижение Парето-оптимальных решений при многокритериальной оптимизации.

генеративный ИИ дизайн лекарств мРНК+3

bioRxiv — Bioinformatics Оригинал

Новость9522 мар.

Исследователи представили RNASTOP — новую вычислительную платформу, сочетающую глубокое обучение с эвристическим поиском для одновременного предсказания и оптимизации химической стабильности молекул мРНК. Проблема химической нестабильности мРНК ограничивает долгосрочную эффективность мРНК-вакцин, и существующие методы предсказания деградации имеют ограниченную точность. RNASTOP демонстрирует улучшение точности на 13% по сравнению с лучшей моделью в конкурсе Stanford OpenVaccine и показывает устойчивую обобщаемость при предсказании деградации полноразмерных последовательностей мРНК. При применении к оптимизации кодонов мРНК для вакцины против вируса ветряной оспы (Varicella-Zoster Virus) система снизила минимальную свободную энергию на 75,73% при сохранении высокой эффективности трансляции. Разработанная модель представляет собой мощный инструмент для ускорения разработки мРНК-терапевтических средств, что особенно актуально в контексте пандемии COVID-19 и создания вакцин нового поколения. Исследование открывает перспективы для рационального дизайна мРНК-препаратов с улучшенной стабильностью и эффективностью. Исходный код проекта доступен в открытом доступе на GitHub.

мРНК глубокое обучение вакцины+4

bioRxiv — Bioinformatics Оригинал

ProtmRNA: Кросс-модальный перенос знаний от белков к матричной РНК (мРНК)

mRNA-GPT: Генеративная модель для проектирования и оптимизации полноразмерных последовательностей мРНК

RNASTOP: Рамка глубокого обучения для предсказания и оптимизации химической стабильности мРНК