Исследователи представили GMIP-PLSR — новый масштабируемый вычислительный фреймворк на базе Nextflow, предназначенный для решения проблемы идентификации причинных генов после проведения полногеномных поисков ассоциаций (GWAS). Основная инновация заключается в использовании метода регрессии на частичных наименьших квадратах (PLSR) для преодоления проблемы мультиколлинеарности признаков, которая ограничивает эффективность существующих инструментов, таких как PoPS. Методология включает интеграцию GWAS с мультиомиксными данными, включая экспрессию генов, белок-белковые взаимодействия и генно-путевые сети. В ходе тестирования на наборах данных GWAS система показала превосходство над PoPS в большинстве сценариев. В рамках тематического исследования неалкогольной жировой болезни печени (NAFLD) использование GMIP-PLSR совместно с данными scRNA-seq позволило выявить наборы генов с более высокой наследуемостью и выраженной обогащенностью в специфических путях заболевания. Инструмент представляет высокую значимость для биоинформатики и персонализированной медицины, обеспечивая эффективную реприоритизацию генов в пост-GWAS анализах.