Исследование представляет новый алгоритм для обнаружения мотивов и контекстов РНК-связывающих белков (RBP), основанный на лингвистических принципах. РНК-связывающие белки регулируют свои РНК-мишени путем связывания с короткими последовательными мотивами, однако механизмы специфичного распознавания остаются неясными для большинства человеческих RBP. Существующие алгоритмы обнаружения мотивов не учитывают структуру и состав фланкирующих регионов мотива, что является существенным недостатком. Предложенный алгоритм использует три важных свойства k-мер (k-mer), придающих лексическую, синтаксическую и семантическую структуры процессу обнаружения мотивов и контекстов. Алгоритм является консенсусным, детерминированным и гибким, интегрируя информацию из последовательных контекстов при построении мотивов RBP. Исследователи продемонстрировали, что их алгоритм достигает высокой точности обнаружения против набора ground-truth и превосходит существующие методы в первичном ранжировании мотивов. Это исследование имеет значение для фундаментальных исследований молекулярной биологии и может в будущем способствовать пониманию механизмов заболеваний на уровне РНК-белковых взаимодействий.