Исследование посвящено решению проблемы фрагментации и несогласованности аннотаций ферментов суперсемейства цитохрома P450 (CYP) в структурных репозиториях. Авторы разработали инновационный рабочий процесс, сочетающий поиск по ключевым словам, скрытые марковские модели (HMM) и структурное выравнивание для надежного обнаружения и верификации белков. В ходе работы было идентифицировано 1 513 депозитов, представляющих 674 уникальные последовательности, которые прошли повторную аннотацию через сервер P450Atlas и ручную проверку. В результате исследования было обнаружено пять новых подсемейств CYP. Созданный набор данных представляет собой первый строго курируемый реестр ферментов P450, интегрированный в общедоступный ресурс с поддержкой автоматизированного конвейера для сканирования новых поступлений. Данная методология критически важна для фармакологии и биотехнологии, так как обеспечивает точный поиск и стандартизированную номенклатуру для крупномасштабного анализа структурных данных.