Исследование представляет TB-Bench — комплексную платформу для оценки эффективности алгоритмов машинного (ML) и глубокого обучения (DL) в прогнозировании лекарственной устойчивости туберкулеза на основе данных полногеномного секвенирования (WGS). Авторы проанализировали 20 различных моделей из 8 существующих исследований, протестировав их на 14 препаратах второй линии. В ходе экспериментов на наборе данных ВОЗ (50 801 образец) было выявлено, что традиционные ML-модели, такие как XGBoost, демонстрируют более высокие показатели PRAUC (от 46% до 93%) для 10 из 14 препаратов по сравнению с глубоким обучением. При внешней валидации на 1 199 образцах было установлено, что ни один класс моделей не показал значительного превосходства над каталожными методами, что указывает на проблемы с обобщающей способностью алгоритмов. Результаты подчеркивают потенциал использования упрощенных ML-моделей в условиях ограниченных ресурсов. Исследователи опубликовали исходный код проекта для обеспечения воспроизводимости и дальнейшего развития стандартов оценки в клинической практике.