Исследователи разработали ViralMap — специализированную модель многоцелевой аннотации, предназначенную для анализа эукариотических вирусных белков. В основе метода лежат представления языковой модели ESM-2, что позволяет предсказывать десять различных классов характеристик, включая топологию доменов, локализацию, посттрансляционные модификации и структурные особенности, напрямую из первичных аминокислотных последовательностей. Модель демонстрирует высокую эффективность, достигая показателя PR-AUC (площадь под кривой точности-полноты) на уровне 0,75 и выше для семи из десяти классов. Тестирование на сложных гликопротеинах, таких как спайк-белок SARS-CoV-2 и белок Env ВИЧ-1, подтвердило способность системы к обобщению на новые штаммы и семейства вирусов. Данная разработка является критически важной для ускорения проектирования вакцин в рамках инициатив вроде «Миссии 100 дней» CEPI, позволяя быстро преобразовывать последовательности новых патогенов в детальные профили для антигенной инженерии.