В статье представлен ConfSeq — инновационный язык описания молекулярных конформаций, разработанный для интеграции трехмерных структур в архитектуры больших языковых моделей (LLM). Исследователи из группы Xiong et al. предложили методологию, которая позволяет переводить сложные пространственные данные о молекулах в текстово-подобные последовательности, понятные для ИИ. Это открывает новые возможности для решения критически важных задач: предсказания конформеров, генерации новых трехмерных молекулярных структур и создания эффективных молекулярных представлений. Применение ConfSeq позволяет моделям выполнять задачи молекулярного моделирования с высокой точностью, сопоставимой с узкоспециализированными графовыми нейросетями. Данная разработка имеет фундаментальное значение для компьютерного дизайна лекарств (CADD) и ускорения разработки новых терапевтических агентов. Технология фактически устраняет разрыв между методами обработки естественного языка и структурной биохимией.