Представлена новая архитектура нейросети CA2PNet, предназначенная для высокоточной сегментации медицинских изображений. Модель использует модули пространственного внимания и прогрессивные расширенные свертки, демонстрируя превосходные результаты на датасетах Kvasir-SEG и BUSI.
Систематический обзор методов глубокого обучения, применяемых для автоматического обнаружения, классификации и сегментации полипов при колоноскопии. В работе анализируются современные архитектуры нейросетей, доступные наборы данных и методы предобработки, а также обсуждаются пути перехода от экспериментальных моделей к клиническому внедрению.
Исследователи представили CREP (Cis-Regulatory Element Predictor) — специализированную модель глубокого обучения, созданную путем тонкой настройки архитектуры Enformer для идентификации цис-регуляторных элементов (CRE), таких как энхансеры, промоторы и изоляторы. В отличие от стандартных моделей, предсказывающих непрерывные эпигеномные сигналы, CREP напрямую классифицирует типы регуляторных элементов на основе последовательности ДНК, используя аннотации REgulamentary для различных типов клеток человека. В ходе экспериментов было доказано, что включение данных по множеству клеточных линий критически важно для точности: например, модель успешно обнаружила вариант SNP Vanuatu, создающий новый эритроидный регуляторный элемент, только при наличии эритроидных данных в обучающей выборке. Анализ ошибок показал, что размытые границы между энхансерами и промоторами отражают их функциональную непрерывность, а не просто ошибки классификации. Данная разработка предоставляет мощный инструмент для функциональной интерпретации некодирующих генетических вариаций, что имеет решающее значение для понимания механизмов развития заболеваний, связанных с мутациями в некодирующих областях генома.
В статье представлен Galaxy Learning and Modeling (GLEAM) — новый программный инструментарий, разработанный для упрощения использования машинного обучения (ML) в биомедицинских исследованиях. Проблема нехватки вычислительных компетенций у биологов решается через предоставление веб-ориентированных инструментов без необходимости написания кода (code-free). GLEAM позволяет работать с табличными, изображенными и мультимодальными наборами данных, стандартизируя процессы разбиения данных, выбора моделей, обучения и оценки результатов. Программный комплекс базируется на вычислительном рабочем месте Galaxy, что обеспечивает масштабируемость и воспроизводимость анализов. Валидация инструментария проводилась на трех критических задачах: прогнозировании ответа пациентов на иммунотерапию, классификации поражений кожи и предсказании рецидивов рака. Результаты тестирования подтвердили высокую точность создаваемых моделей и значительное повышение прозрачности и строгости исследовательских процессов в биомедицине.
Исследователи представили BacteReason — специализированную большую языковую модель (LLM), предназначенную для прогнозирования чувствительности бактерий к антибиотикам с предоставлением механистического обоснования. В отличие от традиционных методов машинного обучения, которые часто работают как «черный ящик», BacteReason использует подход обучения с учителем, где проприетарная модель-наставник генерирует объяснения молекулярных механизмов резистентности. Для обеспечения научной точности модель интегрирована с биомедицинскими базами знаний через протокол TogoMCP, что позволяет привязывать каждый шаг рассуждения к конкретным доказательствам из графов знаний. В ходе тестирования на бенчмарках по экстраполяции модель показала относительное улучшение точности на 43% по сравнению с базовой ненастроенной LLM и на 38% по сравнению с моделью, прошедшей тонкую настройку без использования рациональных обоснований. Данная разработка имеет критическое значение для клинической практики, так как позволяет врачам не только получать прогноз эффективности препарата, но и понимать биологическую причину устойчивости патогена.
В исследовании рассматривается проблема низкой воспроизводимости и сложности проектирования праймеров для метода петлевой изотермической амплификации (LAMP), который является ключевым для портативной диагностики. Авторы разработали и протестировали модели машинного обучения для прогнозирования успеха создания диагностических наборов, используя набор данных из 109 отобранных пар праймеров (включая как успешные, так и неудачные примеры). В ходе работы с помощью алгоритмов WEKA (деревья решений и байесовское обучение) были выявлены критические термодинамические характеристики компонентов F1c и B1c, определяющие эффективность теста. Модель NaiveBayes показала высокую эффективность, достигнув показателя истинно положительных результатов (TP) 0.90 (+/- 0.02) и F-меры 0.91 (+/- 0.01). Работа демонстрирует возможность создания практических прогностических моделей даже на небольших и несбалансированных выборках данных, включая отрицательные результаты исследований. Это имеет критическое значение для оптимизации процесса разработки диагностических систем 'в поле' и снижения затрат на лабораторные испытания.
Исследование посвящено решению критической проблемы воспроизводимости иммуногистохимического (ИГХ) анализа опухолевых тканей при сравнении результатов из разных лабораторий. Авторы протестировали технологию внутрислайдной калибровки, которая использует шкалу концентрации от 0 до 100% с применением первичных суррогатных и вторичных антител для создания стандартизированной кривой осаждения DAB. В ходе эксперимента проводился анализ реакций p53 в биоптатах глиобластомы (GB, IDH-wildtype), выполненный двумя независимыми патологоанатомическими отделениями с последующей цифровизацией при 40-кратном увеличении. Методология включала извлечение признаков интенсивности и текстуры с помощью пакета EBImage в R, а также применение алгоритмов снижения размерности UMAP и кластеризации DBSCAN. Результаты показали, что без калибровки наблюдались значительные различия в паттернах кластеризации интенсивности и текстуры между лабораториями. Однако применение внутрислайдной калибровки в сочетании с полиномиальной регрессией позволило гармонизировать данные примерно на 90%. Данная технология играет ключевую роль в вычислительной патологии, обеспечивая объективность диагностических оценок и поддержку принятия решений в нейроонкологии на основе данных.
Исследователи представили GLOF (Gain and Loss Of Function) — первый масштабный и экспертно проверенный набор данных, предназначенный для обучения и тестирования моделей ИИ в задачах классификации функциональных эффектов миссенс-вариантов. Датасет включает 112 399 миссенс-вариантов, охватывающих 2 809 человеческих генов, которые были классифицированы как LOF (потеря функции), GOF (приобретение функции) или нейтральные. Классификацию проводили сертифицированные клинические генетики в соответствии с международными рекомендациями ACMG. Для формирования выборки использовались данные ClinVar, аннотированные на основе функциональных исследований, а нейтральные варианты были отобраны из gnomAD v3.1 с последующей валидацией по версии v4.1. Особую ценность представляет наличие 97 генов с двунаправленными механизмами (содержащих как LOF, так и GOF варианты), что позволяет моделям машинного обучения более точно различать типы патогенности. Данный ресурс критически важен для разработки предиктивных алгоритмов в геномике, способных предсказывать механизмы заболеваний и помогать в выборе стратегий таргетной терапии.
Исследователи разработали инновационную платформу пространственного ИИ, предназначенную для выявления общих закономерностей в организации тканей при различных патологиях. Методология объединила четыре публичных набора данных пространственной транскриптомики, охватывающих заживление ран, периодонтит, плоскоклеточный рак полости рта и ткани сердца. С помощью использования рекуррентного моделирования, графового обучения и тензорного разложения авторам удалось идентифицировать шесть консервативных «размытых» состояний тканей. Ключевые результаты показали доминирование процессов ремоделирования внеклеточного матрикса, активации фибробластов и эндотелиальной сигнализации во всех исследуемых доменах. Анализ выявил значительное сходство между травмами и патологиями полости рта, в то время как сердечно-сосудистая ткань продемонстрировала более компактную и когерентную пространственную структуру. Исследование подтвердило статистическую значимость выявленных паттернов через тестирование перестановок, показав повышенную модульность графов и снижение пространственной энтропии. Данная работа открывает новые возможности для использования пространственного ИИ в изучении системных воспалительных и стромальных процессов, связывающих локальные травмы с общим состоянием здоровья организма.
В исследовании представлен новый программный инструмент SPARQ-MI (Spatial Phenotyping, Architecture Reconstruction and Quantification from Multiplexed Imaging), предназначенный для автоматизированного анализа микроокружения опухолей (TME) на основе мультиплексной флуоресцентной визуализации. Методология решает критические проблемы текущих методов: неравномерное распределение шума в сложных тканях и трудоемкую ручную аннотацию типов клеток. Авторы протестировали систему на наборе данных тканевых микрочипов PhenoCycler, включающем 37 флуоресцентных каналов, полученных от пациентов с меланомой, проходящих иммунотерапию. Результаты показали, что SPARQ-MI позволяет проводить надежную реконструкцию клеточного состава и пространственной архитектуры тканей с минимальным участием пользователя. Ключевым клиническим выводом стало обнаружение прямой связи между пространственным расположением и функциональным состоянием CD8+ Т-клеток с эффективностью ответа на иммунотерапию. Данная разработка значительно упрощает количественный анализ сложных гистологических образцов и открывает путь к стандартизированной диагностике клинических биоматериалов.
В исследовании представлен новый биоинформатический метод BootDA, предназначенный для точного определения дифференциальной распространенности (DA) таксонов микробиома. Авторы решают критическую проблему искажения данных, вызванную четырьмя факторами: потерей общей микробной нагрузки, различиями в эффективности измерения таксонов, необходимостью использования псевдоподсчетов для обработки нулевых значений и загрязнением образцов. В отличие от существующих методов (ANCOM-BC2, LinDA, MaAsLin 3), BootDA использует непараметрический бутстреп, что позволяет моделировать все источники смещения без предварительных трансформаций данных. Тестирование на симуляциях с высокой разреженностью (>70% нулей) показало, что BootDA обладает наивысшей чувствительностью при строгом контроле частоты ложноположительных результатов. Метод сохраняет эффективность даже в условиях низкой биомассы, когда загрязнение составляет около 50% от общего числа подсчетов. При применении к когорте пациентов с ишемической болезнью сердца (CAD) метод позволил уточнить патологический профиль, выделив два обогащенных рода — Klebsiella и Gemmiger, и исключив вероятные контаминанты. Инструмент доступен в виде R-пакета и применим для любых разреженных многомерных биологических данных.
В статье рассматривается критическая проблема интеграции искусственного интеллекта и мультиомиксных технологий (геномики, протеомики и др.) в практику прецизионной медицины. Авторы подчеркивают, что текущие регуляторные механизмы не успевают за темпами технологического прогресса, создавая разрыв между инновациями и их клиническим внедрением. Основное внимание уделяется вопросам целостности данных, прозрачности алгоритмов и необходимости интеграции доказательств из реальной клинической практики (RWE). В работе проводится сравнительный анализ регуляторных подходов в ЕС и США, выявляя существенные различия в классификации инструментов как медицинских изделий или фармацевтических препаратов. Исследование акцентирует внимание на необходимости создания новых стандартов валидации для ИИ-систем, которые анализируют сверхсложные биологические наборы данных. Результаты дискуссии указывают на то, что гармонизация правил станет ключевым фактором для безопасного и массового использования инструментов следующего поколения в диагностике и стратификации пациентов.
В данной научной работе исследователи представляют инновационный подход к дифференциации синдромов в традиционной китайской медицине (ТКМ), интегрируя математическую теорему Колмогорова — Арнольда (KAT) в архитектуру нейронных сетей. Методология базируется на концепции множественного усиления знаний, что позволяет модели более эффективно обрабатывать сложные, нелинейные взаимосвязи между симптомами и паттернами заболеваний. Использование KAT позволяет значительно снизить вычислительную сложность при сохранении высокой точности аппроксимации функций, что критически важно для клинической диагностики. Результаты исследования демонстрируют превосходство предложенного метода над стандартными глубокими нейронными сетями в задачах классификации синдромов ТКМ. Внедрение данного алгоритма открывает новые возможности для автоматизации экспертной диагностики в восточной медицине, обеспечивая высокую воспроизводимость и точность анализа данных. Практическая значимость работы заключается в создании надежного математического фундамента для гибридных систем поддержки принятия врачебных решений.
Данный систематический обзор посвящен анализу эффективности применения алгоритмов искусственного интеллекта и машинного обучения для управления уровнем глюкозы у пациентов в критических состояниях. Исследование фокусируется на двух ключевых задачах: предиктивном моделировании рисков развития гипо- и гипергликемии, а также автоматизации процессов контроля гликемии в отделениях интенсивной терапии (ОИТ). Авторы систематизировали существующие подходы, оценивая точность различных моделей машинного обучения в реальном времени. Основное внимание уделяется способности ИИ-систем минимизировать вариабельность гликемии, что критически важно для снижения летальности в реанимации. Результаты подчеркивают потенциал внедрения интеллектуальных систем поддержки принятия врачебных решений для персонализированной терапии. Работа представляет высокую значимость для интеграции предиктивной аналитики в протоколы интенсивной терапии.
В данной работе представлен инновационный подход к анализу микроструктуры биологических тканей с использованием гибридной архитектуры графовых трансформеров (Hybrid Graph Transformer). Исследование направлено на решение проблемы точной количественной оценки параметров ткани, что критически важно для патоморфологии и высокоточной диагностики. Авторы предлагают метод, который объединяет возможности трансформеров по захвату глобальных зависимостей и графовых нейронных сетей для моделирования локальных пространственных структур. Использование гибридной модели позволяет значительно повысить точность предсказаний микроструктурных характеристик по сравнению с традиционными методами глубокого обучения. Результаты демонстрируют превосходство предложенного алгоритма в обработке сложных геометрических паттернов, что открывает новые возможности для автоматизированного анализа гистологических изображений. Данная технология имеет высокую практическую значимость для интеграции ИИ в процессы цифровой патологии и персонализированной медицины.
В статье представлен инновационный метод EvoPS, предназначенный для оптимизации обучения моделей на основе полнослойных гистологических изображений (Whole Slide Images, WSI). Основная проблема анализа WSI заключается в их колоссальном размере, что требует выбора наиболее информативных фрагментов (патчей) для обучения. Авторы предлагают использовать эволюционный алгоритм для отбора патчей непосредственно в пространстве эмбеддингов, что позволяет значительно повысить эффективность использования вычислительных ресурсов. Методология EvoPS фокусируется на поиске наиболее репрезентативных признаков, минимизируя избыточность данных при сохранении диагностической ценности. Исследование демонстрирует, что такой подход позволяет достичь высокой точности классификации патологий при сокращении объема обрабатываемых данных. Данная разработка имеет критическое значение для цифровой патологии, ускоряя процесс обучения нейросетей и снижая требования к инфраструктуре при анализе сложных гистологических срезов.
В данном ретроспективном исследовании представлена инновационная методика оценки успешности ЭКО с использованием комбинированной системы скоринга на базе ИИ. Авторы разработали комплексный подход, объединяющий автоматическую сегментацию эндометрия (архитектура U-Net с энкодером VGG16) и классификацию качества эмбрионов (VGG16) с клиническим показателем вероятности беременности SART. Процесс включает стандартизированную обработку ультразвуковых изображений (шумоподавление, нормализация, аугментация) для количественной оценки толщины и эхогенности эндометрия. Разработанная формула композитного скора (CS) позволяет интегрировать данные об эмбрионе, состоянии эндометрия и индивидуальных рисках пациента. Результаты внутренней валидации показали превосходство комбинированной модели: показатель AUC составил 0,94 для прогнозирования биохимической беременности, что выше, чем у отдельных компонентов (0,88 для качества эмбрионов и 0,85 для рецептивности эндометрия). Несмотря на ограничения (одноцентровый дизайн и использование синтетически дополненных данных), исследование подчеркивает потенциал ИИ в персонализации протоколов ЭКО и оптимизации времени переноса эмбриона.
В исследовании представлен новый графовый фреймворк MutationNetwork, предназначенный для решения критической задачи в онкогеномике: отличия функциональных драйверных мутаций от нейтральных пассажирских мутаций. В отличие от традиционных методов, ориентированных на линейный поиск, предложенный метод учитывает трехмерную регуляторную структуру генома, интегрируя локальные перекрытия с дальними внутрихромосомными взаимодействиями. Авторы использовали уникальную схему положительной и отрицательной индексации для представления геномных интервалов в виде узлов, что позволило достичь константного времени поиска сложных взаимосвязей. Методология была протестирована на наборе данных из 560 полногеномных последовательностей рака молочной железы, включая подтипы TNBC (трижды негативный рак) и Luminal A. Результаты показали, что полученные эмбеддинги мутаций позволяют эффективно кластеризовать образцы согласно их биологическим подтипам. Данный подход масштабируем и может быть использован для стратификации пациентов с раком и приоритизации потенциальных некодирующих драйверных мутаций на основе их влияния на сетевую структуру генома.
В исследовании представлен инновационный метод обнаружения аномалий для интеллектуальной капсульной эндоскопии, основанный на принципах семантической связи. Авторы предлагают алгоритм глубокого обучения, который использует сходство признаков между полученными изображениями и эталонным (нормальным) изображением в качестве метрики для выявления патологий. Методология включает тестирование на клиническом наборе данных изображений, захваченных капсулой, в сочетании с симуляцией внутрителесного канала связи. Результаты показывают, что при снижении мощности передачи до 60% от стандартного уровня (QPSK) и интенсивности освещения до 65%, вероятность обнаружения аномалий сохраняется на уровне выше 85%. Применение данного подхода позволяет потенциально увеличить срок службы батареи имплантируемого устройства более чем на 43%. Это исследование имеет критическое значение для создания долговечных и эффективных систем мониторинга внутри организма, снижая энергопотребление без потери диагностической точности.
В статье представлен SNMF (Spatial Non-negative Matrix Factorization) — новый метод деконволюции для пространственной транскриптомики, решающий проблему смешивания нескольких типов клеток в одной «точке» (spot). В отличие от существующих подходов, SNMF является безреференсным методом, что исключает необходимость в предварительно сопоставленных данных секвенирования РНК единичных клеток (scRNA-seq). Авторы интегрировали в стандартную модель NMF матрицу пространственного смешивания, которая учитывает влияние соседних участков ткани для достижения биологически согласованных результатов. Ключевым преимуществом является поддержка GPU-вычислений, что позволяет методу работать на два порядка быстрее конкурентов, завершая бенчмарки менее чем за одну минуту. Тестирование на синтетических и реальных данных, включая образцы меланомы человека, показало значительное превосходство SNMF в точности определения типов клеток. В частности, алгоритм успешно идентифицировал биологически значимые сигнатуры, такие как переходная зона на границе опухоли, без использования эталонных данных. Инструмент реализован в виде R-пакета и доступен в открытом доступе.