Исследование представляет разработку новой перенастраиваемой вычислительной модели BlueSTARR для предсказания регуляторных эффектов некодирующих генетических вариантов, которые сложно интерпретировать только по последовательности ДНК. Авторы обучали несколько глубоких нейросетевых моделей на данных целогеномных STARR-seq анализов из двух клеточных линий и одного режима лекарственного воздействия. Исследование выявило глобальный сигнатурный паттерн по всему геному человека, соответствующий очищающему отбору против вариантов как с потерей, так и с приобретением регуляторной функции, при этом обнаружена значительная тенденция к отбору против усиления функции цис-регуляторных элементов в закрытом хроматине. При тестировании на синтетических энхансерах с мотивами связывания транскрипционных факторов GR и AP-1 модель показала способность обучаться дистанционно-зависимым и зависящим от лечения паттернам связывания и активации репортерных генов. Результаты демонстрируют, что легкие, легко перенастраиваемые модели эффективны для выявления скрытых сигналов в новых экспериментальных данных. Авторы отмечают лишь умеренные различия в производительности между различными архитектурами глубокого обучения при обучении на одном типе данных, при этом даже для промышленных моделей остается значительный запас для улучшений.