Исследователи представили TFBindFormer — новую гибридную архитектуру на базе трансформера, предназначенную для высокоточного предсказания взаимодействий между транскрипционными факторами (ТФ) и ДНК. В отличие от существующих моделей, которые опираются преимущественно на последовательности ДНК и характеристики хроматина, TFBindFormer использует механизм перекрестного внимания (cross-attention) для интеграции специфических данных о белках, полученных из их последовательностей и структур. Это позволяет модели учитывать белок-зависимую специфичность связывания, которую ранее игнорировали вычислительные методы. Тестирование проводилось на сотнях клеточно-специфичных ТФ и сотнях миллионов геномных участков (bins). Результаты показали значительное превосходство над базовыми моделями, работающими только с ДНК, выраженное в существенном росте показателей AUPRC и AUROC. Данная разработка предлагает масштабируемый и эффективный фреймворк для полногеномного картирования регуляторных взаимодействий, что критически важно для понимания механизмов экспрессии генов без дорогостоящих экспериментов ChIP-seq.