Исследователи представили CREP (Cis-Regulatory Element Predictor) — специализированную модель глубокого обучения, созданную путем тонкой настройки архитектуры Enformer для идентификации цис-регуляторных элементов (CRE), таких как энхансеры, промоторы и изоляторы. В отличие от стандартных моделей, предсказывающих непрерывные эпигеномные сигналы, CREP напрямую классифицирует типы регуляторных элементов на основе последовательности ДНК, используя аннотации REgulamentary для различных типов клеток человека. В ходе экспериментов было доказано, что включение данных по множеству клеточных линий критически важно для точности: например, модель успешно обнаружила вариант SNP Vanuatu, создающий новый эритроидный регуляторный элемент, только при наличии эритроидных данных в обучающей выборке. Анализ ошибок показал, что размытые границы между энхансерами и промоторами отражают их функциональную непрерывность, а не просто ошибки классификации. Данная разработка предоставляет мощный инструмент для функциональной интерпретации некодирующих генетических вариаций, что имеет решающее значение для понимания механизмов развития заболеваний, связанных с мутациями в некодирующих областях генома.