В данном исследовании проведен сравнительный анализ шести существующих инструментов (PanTax, PathoScope, StrainGE, Strainify, StrainR2 и StrainScan) для профилирования разнообразия штаммов Escherichia coli на основе коротких чтений метагеномов кишечника. Авторы использовали как реальные наборы данных (ZymoBIOMICS D6331), так и симулированные сообщества различной сложности для оценки точности обнаружения сосуществующих штаммов и их относительной численности. Результаты показали, что только PanTax обеспечил нулевую ошибку при предсказании равного обилия пяти штаммов E. coli. В условиях дифференциального обилия штаммов инструмент StrainScan продемонстрировал самую низкую среднюю абсолютную пропорциональную ошибку (0.89), однако при этом обладал сниженной чувствительностью (0.5). Наивысший показатель F1-меры (0.978) был достигнут инструментом StrainGE, что свидетельствует о его высокой точности и полноте. Для задач предсказания относительного обилия конкретных штаммов, таких как K12-MG1655 и O157:H7 Sakai, наиболее эффективными оказались PanTax и StrainR2 с минимальной ошибкой 0.06. Исследование подчеркивает необходимость выбора конкретного метода в зависимости от прикладных задач биоинформатического анализа метагеномов.