В исследовании представлен новый биоинформатический метод BootDA, предназначенный для точного определения дифференциальной распространенности (DA) таксонов микробиома. Авторы решают критическую проблему искажения данных, вызванную четырьмя факторами: потерей общей микробной нагрузки, различиями в эффективности измерения таксонов, необходимостью использования псевдоподсчетов для обработки нулевых значений и загрязнением образцов. В отличие от существующих методов (ANCOM-BC2, LinDA, MaAsLin 3), BootDA использует непараметрический бутстреп, что позволяет моделировать все источники смещения без предварительных трансформаций данных. Тестирование на симуляциях с высокой разреженностью (>70% нулей) показало, что BootDA обладает наивысшей чувствительностью при строгом контроле частоты ложноположительных результатов. Метод сохраняет эффективность даже в условиях низкой биомассы, когда загрязнение составляет около 50% от общего числа подсчетов. При применении к когорте пациентов с ишемической болезнью сердца (CAD) метод позволил уточнить патологический профиль, выделив два обогащенных рода — Klebsiella и Gemmiger, и исключив вероятные контаминанты. Инструмент доступен в виде R-пакета и применим для любых разреженных многомерных биологических данных.