В исследовании представлен DeePEn — новый специализированный бенчмарк, предназначенный для оценки способности моделей машинного обучения предсказывать пригодность (fitness) белков при увеличении мутационного расстояния от дикого типа. Авторы решают проблему отсутствия надежных инструментов, которые могли бы имитировать реальные вызовы инженерии белков, где мутации часто накапливаются. Методология основала исследование на анализе четырех наборов данных глубокого мутационного сканирования (DMS) из репозитория ProteinGym, включающих данные о множественных точечных мутациях. В ходе тестирования были оценены современные белковые языковые модели (pLMs), как общие, так и основанные на биофизике, а также не-трансформерные нейронные сети. Результаты показали, что точность всех протестированных моделей закономерно снижается по мере роста количества одновременных аминокислотных замен (SAVs). Исследование подчеркивает, что ни одна существующая метрика не способна в полной мере охватить разнообразие задач белковой инженерии, и предлагает DeePEn как многомерный ресурс для оценки моделей на «дальних» вариантах белков.