Проведен комплексный библиометрический анализ публикаций за период с 2000 по 2025 год, посвященных применению ИИ в изучении сонных артерий. Исследование выявило переход к прецизионной медицине на основе мультимодальных данных и подчеркнуло растущую роль ИИ в ранней диагностике и мониторинге заболеваний.
Исследование посвящено изучению причин анемии у молодых женщин и разработке мобильного приложения на базе ИИ для скрининга и управления состоянием. Разработанная модель машинного обучения показала точность 74,39%, что выше точности традиционной диагностики (71%) в рамках данного исследования.
Исследование оценивает эффективность системы на базе ИИ для контроля выполнения упражнений при болях в шее. Результаты показали высокую валидность программы (IOC 0.86–1.00) и умеренную надежность при измерении точности и времени выполнения упражнений.
Исследование посвящено изучению способности моделей глубокого обучения предсказывать динамику и гибкость белков, что критически важно для понимания их биологических функций. Авторы провели количественный анализ, сравнивая профили среднеквадратичных флуктуаций (MSF) на уровне остатков, полученные из сгенерированных ансамблей структур, с экспериментальными данными и результатами молекулярной динамики. В качестве бенчмарков использовались 70 наборов данных ЯМР, 43 пары рентгеноструктурных данных в разных конформациях, 82 структуры криоэлектронной микроскопии и симуляции молекулярной динамики для 10 белков. Сравнивались возможности AlphaFold3, AlphaFold2 и RosettaFold; результаты показали, что AlphaFold3 демонстрирует наилучшую точность в предсказании гибкости. Было установлено, что точность прогнозов возрастает при увеличении количества генерируемых моделей до 15. Работа доказывает, что ансамбли структур, созданные ИИ, могут эффективно служить суррогатами для оценки физической подвижности белков, и сопровождается публикацией трех Jupyter Notebooks для практического применения метода.
В статье представлен GeneFior — новый прозрачный рабочий процесс (workflow), предназначенный для обнаружения целевых генетических последовательностей, таких как гены антибиотикорезистентности, напрямую из данных геномного и метагеномного секвенирования. Авторы решают проблему традиционных методов, которые полагаются на предварительную сборку (assembly), что часто приводит к потере данных о низкокопийных вариантах и нуклеотидном разнообразии. Методология GeneFior интегрирует в единую систему такие инструменты, как BLAST, DIAMOND, Bowtie2, BWA и Minimap2, позволяя проводить поиск как ДНК, так и белковых последовательностей по любым пользовательским базам данных. Ключевым преимуществом является применение погенного порога идентичности и покрытия на уровнях ридов и генов, что значительно снижает количество ложноположительных результатов при сохранении высокой чувствительности к вариантам с однонуклеотидными различиями. Инструмент обеспечивает полную воспроизводимость за счет экспонирования всех параметров выравнивания и сохранения промежуточных результатов, формируя матрицы консенсусного обнаружения. Это позволяет исследователям напрямую оценивать влияние выбора инструментов и конфигурации параметров на итоговые профили генов, что критически важно для точной метагеномной диагностики.
Исследователи представили Cryosearch — инновационную систему для автоматизированного моделирования макромолекулярных комплексов на основе библиотек мономеров протеомного масштаба. В основе метода лежит использование алгоритма поиска по дереву Монте-Карло (MCTS) с системой вознаграждений, основанной на корреляции, что позволяет эффективно исследовать колоссальное комбинаторное пространство возможных белковых взаимодействий. Система способна осуществлять автономную сборку молекулярных комплексов de novo на основе карт электронной плотности промежуточного разрешения, что ранее требовало трудоемкого ручного моделирования. Методология позволяет сопоставлять различные комбинации белковых доменов с картами криоэлектронной микроскопии (cryo-EM) для поиска оптимального структурного соответствия. Данная разработка значительно ускоряет структурную клеточную биологию, позволяя визуализировать функциональные молекулы в их естественной среде с высокой точностью. Применение Cryosearch открывает новые возможности для автоматизации структурного анализа протеомов и понимания архитектуры сложных биологических систем.
Исследователи представили SpatialArtifacts — новый вычислительный фреймворк, предназначенный для автоматического обнаружения технических артефактов в данных пространственной транскриптомики. Проблема таких дефектов, как сухие участки, отслоение тканей и неравномерное покрытие реагентами, критически влияет на точность анализа, особенно на границах образцов. Методология SpatialArtifacts сочетает в себе метод обнаружения выбросов на основе медианного абсолютного отклонения (MAD) с операциями математической морфологии. Использование фокальных операций, таких как заполнение 3x3, контур 5x5 и звездная связность, позволяет эффективно объединять низкокачественные споты в кластеры, сохраняя при этом истинные биологические домены. Разработанная иерархическая система классификации позволяет различать краевые и внутренние артефакты, а также разделять их по размеру, что упрощает последующую очистку данных. Эффективность метода была подтверждена на данных гиппокампа человека, дорсолатеральной префронтальной коры и тканей колоректального рака с использованием платформ 10x Genomics Visium и VisiumHD. Инструментарий доступен в открытом доступе через репозитории Bioconductor и PyPI.
Исследование посвящено критической проблеме безопасности при использовании ИИ-ассистентов (ambient scribing) для транскрибации и создания медицинских записей. Авторы проанализировали, как большие языковые модели (LLM) обрабатывают разговоры между врачом и пациентом, фокусируясь на риске несанкционированного включения персональных данных третьих лиц в итоговые клинические заметки. В ходе экспериментов тестировались модели LLaMA 3.1 (8B и 70B), Mixtral 8×7B, 8×22B, а также проприетарные модели Claude 3.5 Haiku и Sonnet. Результаты показали, что все протестированные модели допускали утечки конфиденциальной информации третьих лиц, даже если они правильно идентифицировали её как неприемлемую для записи. Использование специальных инструкций по приватности снизило частоту утечек, но не обеспечило полной защиты. Исследование подчеркивает необходимость разработки систем с принципом «privacy-by-design» и разделения процессов генерации текста и редактирования конфиденциальных данных для минимизации рисков в реальной клинической практике.
Исследователи представили FoldaVirus — новый методологический подход и веб-сервис (foldavirus.org), предназначенный для моделирования четвертичной структуры вирусных капсидов. В то время как AlphaFold эффективно предсказывает третичную структуру отдельных белков оболочки (CP), он не справляется с их сборкой в полноценные вирусные частицы. Разработанный метод комбинирует предсказания AlphaFold с математическими знаниями об икосаэдрической архитектуре (симметрии T=1, 3, 4 и т.д.), характерной для конкретных семейств вирусов. Для устранения стерических столкновений на интерфейсах субъединиц модели проходят минимизацию энергии Amber. Валидация моделей проводилась с помощью расчета расстояния Махаланобиса на основе аминокислотных остатков (интерфейсных, ядерных и поверхностных) в сравнении с экспериментально известными структурами. Авторам удалось успешно сгенерировать капсиды симметрии вплоть до T=9, включая пикорнавирусы с псевдо-T=3 симметрией. Данный инструмент критически важен для преодоления разрыва между огромным массивом известных аминокислотных последовательностей и ограниченным числом экспериментально определенных 3D-структур вирусов.
Исследование посвящено решению критической проблемы клинической генетики — интерпретации миссенс-вариантов неопределенного значения (VUS). Авторы представляют новый количественный показатель — среднюю силу доказательств (mean evidence strength, MES), который позволяет оценивать вычислительные предикторы эффекта вариантов (VEP) и мультиплексные анализы (MAVE) в соответствии с руководствами ACMG/AMP. В ходе работы с использованием фреймворка acmgscaler было проведено калибрование 12 популяционных VEP для 367 генов заболеваний и проанализировано 15 наборов данных MAVE. Результаты показали, что традиционная метрика AUROC не всегда коррелирует с реальной клинической ценностью: MAVE продемонстрировали высокий средний показатель MES, несмотря на более низкий AUROC по сравнению с некоторыми VEP. В частности, предиктор CPT-1 показал наивысший MES и обеспечил наиболее значительный объем калиброванных доказательств для наибольшей доли VUS из базы ClinVar. Предложенный фреймворк MES предоставляет практический инструмент для оценки того, насколько эффективно ИИ-модели и экспериментальные данные могут использоваться для принятия клинических решений.
В исследовании представлен IDBSpred — новый метод на основе последовательностей для предсказания сайтов связывания внутренне неупорядоченных белков (IDP) на структурированных белках-партнерах на уровне отдельных аминокислотных остатков. Методология включает использование эмбеддингов последовательностей, полученных с помощью мощной языковой модели белка ESM-2, в качестве входных данных для классификатора на базе многослойного перцептрона (MLP). Для обучения и тестирования использовалась база данных DIBS, содержащая более 700 нередундантных комплексов IDP-белок. Исследование выявило, что сайты связывания обогащены ароматическими остатками (Trp, Tyr, Phe) и полярными заряженными аминокислотами, при этом наблюдается дефицит Ala и малых конформационно ограниченных остатков. Разработанный классификатор показал высокую эффективность с показателем ROC AUC 0.87 и средней точностью (average precision) 0.61. Результаты структурных исследований подтвердили, что предсказанные сайты в значительной степени соответствуют экспериментально определенным интерфейсам связывания. Данный инструмент предоставляет практическую основу для изучения интерфейсов, опосредованных IDP, и идентификации потенциальных терапевтических мишеней (hotspots).
В статье исследуется инновационный подход к оценке качества больших языковых моделей (LLM) в медицине с использованием методов компьютерного адаптивного тестирования (CAT). Традиционные методы бенчмаркинга требуют огромных вычислительных ресурсов и затрат, тогдая предложенная методология позволяет значительно оптимизировать процесс проверки медицинских знаний ИИ. Исследование фокусируется на том, как алгоритмы адаптивного тестирования могут динамически подбирать сложность вопросов в зависимости от ответов модели, что сокращает количество необходимых тестов без потери точности оценки. Основной результат заключается в возможности достижения сопоставимой точности оценки при существенно меньших затратах на токены и время. Данный подход имеет критическое значение для быстрой итерации медицинских ИИ-систем и их регулярного аудита на соответствие клиническим стандартам. Внедрение CAT в процесс валидации LLM может стать новым стандартом в индустрии разработки медицинского искусственного интеллекта.
В исследовании рассматривается практическое применение алгоритмов искусственного интеллекта для оптимизации процесса маммографического скрининга в условиях клиник, обслуживающих уязвимые группы населения. Основная методология заключается в использовании ИИ для предварительной стратификации пациенток по уровню риска, что позволяет приоритизировать наиболее критические случаи. Внедрение системы позволило значительно ускорить рабочий процесс (workflow), сократив время ожидания для пациенток с высокими показателями риска. Результаты демонстрируют, что использование ИИ в условиях 'safety-net settings' помогает эффективно распределять ресурсы и повышать точность раннего выявления патологий. Данная технология имеет высокую клиническую значимость, так как она не только оптимизирует нагрузку на персонал, но и обеспечивает более быстрый доступ к диагностике для групп риска. Исследование подтверждает потенциал автоматизированной сортировки снимков для снижения нагрузки на рентгенологов и улучшения исходов скрининга.
Исследователи представили новый метод F2S (Features to Signatures), предназначенный для предсказания частоты возникновения побочных эффектов лекарственных препаратов с учетом их хиральности. Основная проблема заключается в том, что энантиомеры (зеркальные молекулы) могут иметь идентичный химический состав, но радикально разные профили безопасности и эффективности. Методология F2S использует направленную графовую нейронную сеть с передачей сообщений по связям (directed-bond message-passing GNN) для извлечения стереохимических конфигураций из структуры молекул, в то время как текстовые описания побочных эффектов кодируются с помощью предобученной модели PubMedBERT. В ходе тестирования в сценариях «холодного старта» и проспективной оценки метод показал результаты, сопоставимые с современными SOTA-решениями, при этом значительно снизив количество ложноположительных результатов. Особое преимущество F2S заключается в способности точно предсказывать различия в частоте побочных эффектов между парами энантиомеров. Кроме того, модель формирует компактные 10-мерные сигнатуры, которые обеспечивают интерпретируемость: сигнатуры лекарств отражают их терапевтический класс, а сигнатуры эффектов — фенотипическое сходство.
Исследователи разработали инновационную модель глубокого обучения под названием PLASMA (Predicting Lung Adenocarcinoma recurrence via Selective Multimodal Attention), предназначенную для прогнозирования раннего рецидива аденокарциномы легкого (LUAD). Модель использует мультимодальный подход, интегрируя клинические данные, профили экспрессии мРНК и данные о мутациях пациентов с первичными стадиями I-III. Обучение проводилось на масштабном наборе данных The Cancer Genome Atlas (TCGA), что позволило достичь высокой точности. В ходе тестирования PLASMA продемонстрировала превосходство над традиционными методами машинного обучения, показав показатель AUROC 85,0% на тестовой выборке TCGA и 76,5% на внешней валидационной выборке TRACERx Lung. Данная разработка имеет высокую клиническую значимость, так как позволяет проводить эффективную стратификацию рисков и более точно прогнозировать выживаемость пациентов после резекции опухоли. Использование мультимодальных нейросетей открывает новые возможности для персонализированной онкологии в диагностике рецидивов.
В статье представлен HESTIA (Histology-Enhanced Scalable cross-Resolution inTegration for spatial trAnscriptomics) — инновационный мультимодальный алгоритм, разработанный для анализа крупномасштабных данных пространственной омики. Основная проблема текущих методов заключается в огромных объемах данных и высокой разреженности транскриптомных данных при переходе к субклеточному уровню, что вызывает дефицит памяти у существующих систем. HESTIA решает эту задачу за счет оптимизации вычислений, позволяя обрабатывать массивы данных, недоступные для других алгоритмов. Исследование показало, что метод превосходит текущие аналоги по точности кластеризации и пространственной непрерывности, обеспечивая четкое разграничение структурных границ тканей. При применении алгоритма к патологическим образцам легких и колоректального рака удалось успешно картировать внутриопухолевую гетерогенность и идентифицировать специфические иммунные микроокружения. Данная разработка имеет критическое значение для прецизионной диагностики и понимания механизмов развития онкологических заболеваний на молекулярном уровне.
В исследовании представлен новый фреймворк Regression-Based Boolean Rule (RBBR), предназначенный для решения проблемы «черного ящика» в медицинском ИИ. Метод позволяет автоматически генерировать прозрачные и понятные врачам булевы правила (логические комбинации признаков), которые служат основой для прогнозирования заболеваний. В отличие от глубоких нейросетей, RBBR создает человекочитаемые логические связки (например, «если симптом А и симптом Б, то высокий риск»), используя ридж-регрессию и байесовский информационный критерий для отбора наиболее точных и лаконичных наборов правил. Тестирование на шести реальных наборах данных, включая диагностику рака легких, рака молочной железы, сердечной недостаточности и диабета, показало высокую эффективность: коэффициент детерминации R2 достигал 0,92. Исследование доказало, что модель способна выявлять специфические подгруппы пациентов, такие как гендерно-зависимые комбинации симптомов при диабете или гистопатологические особенности при раке груди. Данная разработка критически важна для клинической практики, так как она обеспечивает баланс между высокой предсказательной способностью и необходимой интерпретируемостью для принятия этичных и безопасных медицинских решений.
В данной научной работе представлена новая методология прогнозирования аффинности взаимодействия лекарственных соединений с биологическими мишенями (DTA), которая учитывает пространственную организацию молекул (стереохимию). Авторы указывают на критический недостаток существующих моделей, которые полагаются только на связность атомов и игнорируют хиральность, что приводит к ошибкам при анализе энантиомеров — молекул с идентичным составом, но разной трехмерной структурой. Предложенный фреймворк использует графовую нейронную сеть с передачей сообщений по направленным связям (directed-bond message passing GNN) для захвата конфигураций энантиомеров, в сочетании с эмбеддингами белковых последовательностей. Экспериментальная проверка на наборе данных Davis подтвердила улучшение точности прогнозирования аффинности. Особую значимость представляет кейс-стади на специально подготовленном наборе данных энантиомеров: модель успешно разделила их показатели аффинности в соответствии с экспериментально наблюдаемой биологической активностью. Это делает метод перспективным инструментом для более точного и химически достоверного дизайна лекарств в рамках компьютерного моделирования (in silico).
В статье представлен MoCoO — инновационный модульный фреймворк, предназначенный для анализа данных секвенирования РНК единичных клеток (scRNA-seq). Архитектура объединяет вариационный автоэнкодер (VAE), нейронные обыкновенные дифференциальные уравнения (Neural ODE) и метод Momentum Contrast (MoCo), дополненные этапом уточнения через Flow Matching (FM). Исследование, проведенное на 20 наборах данных scRNA-seq, показало, что синергия ODE и MoCo позволяет эффективно моделировать как дискретную идентичность типов клеток, так и непрерывные траектории их развития. Результаты тестов подтверждают превосходство модели: комбинация VAE+ODE+MoCo+FM достигла лучших показателей по метрикам ASW (0.257) и DAV (1.359), а полная версия MoCoO показала лучшие результаты по DRE (0.678), DREX (0.660) и CAL. Использование Flow Matching позволило улучшить качество эмбеддингов в 92% случаев (по метрике DREX). Разработанный метод успешно применяется для аннотации клеток, количественной оценки неопределенности и обнаружения ветвлений в процессах дифференцировки, обеспечивая высокую корреляцию псевдовремени с каноническими маркерными генами.
В исследовании представлен новый алгоритм LAML-Pro, предназначенный для совместного вывода генотипов клеток и реконструкции деревьев их происхождения (филогений). Традиционные методы разделяют процесс на идентификацию мутаций и построение дерева, что приводит к накоплению ошибок: например, при использовании флуоресцентной визуализации частота неверных генотипов достигает 25-50%. Авторы разработали модель Probabilistic Mixed-type Missing Observation (PMMO), которая учитывает процессы редактирования генома и ошибки наблюдения одновременно. Благодаря использованию разреженности переходов в модели PMMO, LAML-Pro способен обрабатывать данные тысяч клеток менее чем за один час. Тестирование на симулированных данных показало значительное превосходство над существующими методами в точности реконструкции. При применении к реальным данным систем отслеживания линий на основе визуализации, алгоритм позволил снизить количество ошибок генотипирования в 5 раз и обеспечил более высокую пространственную когерентность деревьев клеточных линий.