GraphHDBSCAN* — это новый алгоритм машинного обучения для кластеризации данных одноячеистого секвенирования РНК (scRNA-seq), широко используемого в биомедицинских исследованиях для анализа клеточного разнообразия. Метод представляет собой иерархическое расширение HDBSCAN*, которое работает непосредственно с графовой структурой данных, устраняя необходимость в ручной настройке гиперпараметров. В отличие от существующих подходов, фокусирующихся на плоских кластерах, GraphHDBSCAN* сохраняет иерархическую организацию клеток, выявляя как широкие типы клеток, так и их специализированные подтипы. Исследователи протестировали метод на множестве наборов данных scRNA-seq и продемонстрировали, что алгоритм восстанавливает биологически значимые иерархии, включая тонкую структуру субпопуляций моноцитов. Метод обеспечивает высококачественные плоские кластеризации, превосходящие широко используемые методы обнаружения сообществ. GraphHDBSCAN* особенно важен для онкологических исследований, иммунологии и разработки персонализированных терапий, где точное определение клеточных популяций критично для понимания механизмов заболеваний и оценки ответа на лечение.