В исследовании представлен Parallel-REM — высокопроизводительный Python-пайплайн, предназначенный для ускорения построения сетей микробных взаимодействий. Авторы решают проблему вычислительной сложности существующих методов (например, реализаций в R), которые не справляются с высокоразмерными метагеномными данными из-за однопоточной обработки. Методология включает использование стратегии параллелизации «Master-Worker» с применением библиотек joblib и statsmodels, а также интеграцию фильтрации дисперсии и проверки разреженности матриц. При тестировании на масштабном клиническом наборе данных, включающем 70 185 образцов и 466 видов, система показала ускорение в 26,1 раза на 64-ядерной архитектуре, сократив время вычислений с нескольких дней до считанных минут. Статистическая валидация подтвердила точность метода: согласованность направленности связей с оригинальными алгоритмами составила более 99,9%. Разработка критически важна для создания качественных топологических признаков, которые затем могут использоваться в глубоком обучении и трансформерных архитектурах для медицинской диагностики.