В исследовании представлен FLASH — инновационный интерпретируемый фреймворк на базе глубокого обучения, который работает напрямую с необработанными данными секвенирования. В отличие от традиционных GWAS, FLASH способен предсказывать фенотипы для генетических вариантов, которые не встречались в процессе обучения, и эффективно интегрировать структурные вариации. Тестирование на более чем 35 000 изолятов бактерий, грибков и вирусов показало, что метод достигает высокой точности, сопоставимой или превосходящей существующие специализированные решения (SOTA). Алгоритм позволяет идентифицировать канонические мишени для лекарственных препаратов ab initio и находить новые пан-видовые предикторы вирулентности, даже если они не аннотированы в базах данных NCBI. Особую значимость представляет способность FLASH предсказывать такие сложные характеристики, как диапазон хозяев бактериофагов, что ранее считалось невозможным методами GWAS. Данная технология открывает новые горизонты в прогнозировании функций генов и фенотипов во всем древе жизни, особенно в условиях ограничений биоэтики и высокой генетической сложности патогенов.