Исследование посвящено совершенствованию методов диагностики болезни Лайма путем разработки специфических аптамеров, связывающихся с белком CspZ на поверхности бактерии Borrelia burgdorferi. Авторы предлагают комплексный методологический подход, объединяющий традиционный процесс SELEX с передовыми методами машинного обучения. В основе работы лежит использование машины ограниченного распространения (Restricted Boltzmann Machine, RBM) для цифрового моделирования финальных раундов отбора последовательностей. Для повышения эффективности модели в RBM интегрированы методы текстового анализа, такие как word2vec и n-граммы, что позволяет сопоставлять генерируемые in silico последовательности с реальными кандидатами, отобранными in vitro. Особое внимание уделено интеграции геометрических представлений последовательностей в модель RBM, что критически важно при работе с ограниченными наборами данных в условиях огромного пространства возможных последовательностей. Итоговый алгоритм включает в себя компьютерный отбор потенциально сильных связывающих последовательностей с последующей их обязательной экспериментальной валидацией, что значительно повышает точность и скорость разработки диагностических инструментов.