Исследователи представили DIANA — многозадачную нейронную сеть, предназначенную для автоматизации анализа метаданных в области древней метагеномики. В отличие от традиционных методов, зависящих от референсных баз данных, DIANA предсказывает ключевые категории метаданных непосредственно на основе обилия унитигов. Модель была обучена на колоссальном массиве данных, включающем 2 597 регистраций с общим объемом собранных последовательностей 1,72 Тб. В ходе тестирования система продемонстрировала высокую точность: идентификация хозяина образца составила 94,6%, определение типа сообщества — 90,0%, а типа материала — 88,9%. Важной инновацией является способность к семантической генерализации, позволяющая корректно классифицировать даже те образцы, подтипы которых не встречались в обучающей выборке. Данная технология значительно ускоряет процессы валидации метаданных и контроля качества, что критически важно для масштабных исследований древних микробиомов.