Исследование посвящено разработке методов высокоточного разделения пациентов на подгруппы с использованием данных секвенирования РНК единичных клеток (scRNA-seq). Авторы проанализировали 11 различных когорт scRNA-seq и сравнили современные вычислительные подходы к представлению данных на уровне образцов. Результаты показали, что методы, основанные на анализе композиции типов клеток, сопоставимы или превосходят по эффективности сложные алгоритмы, при этом требуя на порядки меньше вычислительных ресурсов. В частности, использование пропорций типов клеток, трансформированных методом центрированного логарифмического отношения (CLR), обеспечило наилучшую стратификацию и устойчивость к батч-эффектам. Было установлено, что клинически значимые различия между пациентами часто обусловлены изменениями в небольшом подмножестве высоко вариативных типов клеток. Для практического применения авторы представили scECODA — новый пакет с открытым исходным кодом на языке R, предназначенный для масштабируемого и интерпретируемого анализа композиционных данных. Данный подход позволяет напрямую связывать структуру когорты с конкретными клеточными популяциями, что критически важно для клинической трансляции и понимания механизмов заболеваний.