Исследователи разработали новый биоинформатический подход для верификации того, насколько клеточные линии, используемые в лабораторных моделях почек, соответствуют нативным типам клеток. Методология основана на сопоставлении данных bulk RNA-seq (массового секвенирования РНК) с эталонными профилями, полученными из наборов данных scRNA-seq (секвенирования РНК единичных клеток) человека и мыши. В ходе исследования сравнивались три статистические меры сходства и три алгоритма машинного обучения: Random Forest, XGBoost и TabPFN (фундаментальная модель для табличных данных). Результаты показали, что использование корреляции Спирмена и модели TabPFN обеспечивает наивысшую точность идентификации типов клеток, особенно при использовании списков маркерных генов. При тестировании популярных линий было установлено, что клетки OK сохраняют идентичность проксимальных канальцев (особенно под воздействием напряжения сдвига), в то время как линии HK-2, HKC-8 и HKC-11 демонстрируют непоследовательные результаты. Для практического применения авторы представили веб-инструмент CellMatchR, позволяющий исследователям объективно оценивать стабильность и применимость используемых клеточных моделей в экспериментах по изучению заболеваний почек.