Исследование представляет модель на базе VGG16, которая использует признаки симметрии тканей для раннего выявления аденокарциномы толстой кишки. Авторы интегрировали методы XAI (Grad-CAM, SHAP, LIME) для устранения проблемы «черного ящика» и достигли точности 99,85% на наборе из 10 000 гистопатологических снимков.
В данной работе представлен emb2dis — инновационный инструмент глубокого обучения, предназначенный для предсказания неупорядоченности белков (IDPs) непосредственно по их аминокислотной последовательности. Методология исследования базируется на использовании предобученных языковых моделей белков (pLMs) для генерации эмбеддингов, которые затем обрабатываются гибридной архитектурой, сочетающей остаточные сети (ResNets) и расширенные (dilated) свертки. Такое архитектурное решение позволяет значительно увеличить рецептивное поле модели, обеспечивая захват расширенного контекста для каждого аминокислотного остатка. В ходе тестирования на актуальном слепом бенчмарке CAID3 модель заняла первое место в категории Disorder-PDB, продемонстрировав высокие показатели AUC и Fmax. Кроме того, emb2dis вошел в топ-10 лучших методов на наборе данных Disorder-NOX. Разработка имеет высокую практическую значимость, так как позволяет эффективно и дешево предсказывать структурные особенности белков, связанные с различными заболеваниями, заменяя дорогостоящие экспериментальные методы. Авторы обеспечили открытый доступ к исходному коду и веб-демо для широкого использования в биоинформатике.
В исследовании представлена SSPSPredictor — инновационная мультимодальная модель глубокого обучения, предназначенная для идентификации фазово-разделяющихся белков (PSP), которые лежат в основе формирования безмембранных органелл в клетках. Методология модели базируется на слиянии двух подходов: использовании языковой модели белков ESM-2 для анализа аминокислотных последовательностей и графовой нейронной сети GVP для извлечения структурных признаков. В отличие от существующих инструментов, SSPSPredictor демонстрирует сбалансированную точность в определении эндогенных PSP, прогнозировании склонности к жидкостно-жидкостному фазовому разделению (LLPS) и локализации ключевых доменов, ответственных за этот процесс. Анализ человеческого протеома с помощью данной модели показал, что доля внутренне неупорядоченных белков (IDP), подверженных LLPS, значительно превышает аналогичный показатель для белков с четко выраженной структурой. Особую клиническую значимость представляет обнаружение связи между патогенными мутациями и повышенной склонностью к фазовому разделению, особенно в неупорядоченных регионах белков. Это открывает новые возможности для понимания механизмов заболеваний на аминокислотном уровне с помощью ИИ.
В исследовании, опубликованном в журнале npj Digital Medicine, представлена инновационная методология глубокого обучения, предназначенная для точного определения происхождения опухолевых клеток. Авторы разработали подход с использованием 'мягкого' многоклассового дополнения признаков (soft multiclass feature augmentation), который позволяет эффективно анализировать полнослойные изображения (WSI) как цитологического, так и гистологического происхождения. Основная цель работы заключается в автоматизации процесса дифференциальной диагностики, что критически важно при работе с неопределенными типами опухолей. Методология позволяет модели учитывать распределение признаков между различными классами, повышая устойчивость прогноза. Применение данного метода в клинической практике может значительно ускорить постановку диагноза и снизить вероятность врачебной ошибки при интерпретации сложных гистологических срезов. Результаты демонстрируют потенциал интеграции подобных алгоритмов в цифровые патоморфологические системы для повышения точности онкологической диагностики.
Представлена новая гибридная модель Quantum-SpinalNet, сочетающая Swin ResUNet3+ для сегментации опухолей и квантовую нейронную сеть (DQNN) для классификации. Исследование показало высокую эффективность на наборах данных CBIS-DDSM и DDSM с точностью 93,8%, что делает метод перспективным для клинической диагностики.
В исследовании представлена новая архитектура CBA-TransNet, объединяющая ResNet50 и Vision Transformer (ViT) для диагностики рака полости рта. Использование механизма внимания CBAM позволило достичь точности классификации 98,97%, эффективно сочетая извлечение локальных и глобальных признаков на гистопатологических снимках.
Разработана гибридная мультимодальная нейросеть, сочетающая классические CNN и квантовые вариационные схемы для диагностики болезни Паркинсона по рисункам спиралей и клиническим данным. Модель показала высокую точность (до 97.28%) и обеспечивает интерпретируемость результатов с помощью Grad-CAM и анализа чувствительности.
Разработан мультимодальный ИИ-фреймворк, объединяющий гистопатологические изображения и клинические данные для диагностики рака эндометрия. Модель демонстрирует высокую точность (AUC 0.95), обеспечивая при этом интерпретируемость результатов и защиту конфиденциальности данных пациентов.
Исследование представляет TB-Bench — комплексную платформу для оценки эффективности алгоритмов машинного (ML) и глубокого обучения (DL) в прогнозировании лекарственной устойчивости туберкулеза на основе данных полногеномного секвенирования (WGS). Авторы проанализировали 20 различных моделей из 8 существующих исследований, протестировав их на 14 препаратах второй линии. В ходе экспериментов на наборе данных ВОЗ (50 801 образец) было выявлено, что традиционные ML-модели, такие как XGBoost, демонстрируют более высокие показатели PRAUC (от 46% до 93%) для 10 из 14 препаратов по сравнению с глубоким обучением. При внешней валидации на 1 199 образцах было установлено, что ни один класс моделей не показал значительного превосходства над каталожными методами, что указывает на проблемы с обобщающей способностью алгоритмов. Результаты подчеркивают потенциал использования упрощенных ML-моделей в условиях ограниченных ресурсов. Исследователи опубликовали исходный код проекта для обеспечения воспроизводимости и дальнейшего развития стандартов оценки в клинической практике.
В исследовании представлен HiReS (High-Resolution Segmentation) — программный конвейер с открытым исходным кодом, предназначенный для автоматизации морфометрического анализа планктона. Основная проблема, которую решает метод, заключается в невозможности обработки полноразмерных изображений высокого разрешения стандартными методами глубокого обучения из-за ограничений оперативной памяти. Методология HiReS основана на разделении изображений на перекрывающиеся фрагменты (chunks), применении сегментации экземпляров на базе архитектуры YOLO, последующей реконструкции полигональных аннотаций в пространстве полного изображения и удалении дубликатов. Авторы протестировали систему на видах Daphnia pulex, Daphnia galeata и Simocephalus vetulus, показав, что автоматизированные измерения точно воспроизводят структуру распределения признаков, полученную вручную. Несмотря на выявленное систематическое положительное смещение (multiplicative scaling offset), после центрирования данных расхождения между автоматическим и ручным методами оказались минимальными. Важным практическим результатом является то, что при малых объемах выборки медианные значения, полученные моделью, могут превосходить точность ручных оценок. Данный инструмент представляет интерес для биомедицинских исследований и экологии, где требуется высокоточный количественный анализ микрообъектов.
Исследователи представили StriMap — единую платформу на базе глубокого обучения, предназначенную для высокоточного предсказания взаимодействий между Т-клеточными рецепторами (TCR), пептидами и молекулами HLA. В отличие от существующих методов, StriMap интегрирует физико-химические свойства, контекст последовательностей и структурные особенности интерфейсов распознавания, что позволяет моделировать сложные трехсторонние взаимодействия. В ходе тестирования платформа продемонстрировала передовые показатели точности (state-of-the-art) и высокую обобщающую способность. В качестве практического применения была проведена масштабная проверка 13 миллионов пептидов, полученных из 43 241 бактериального белка, в контексте болезни Бехтерева (анкилозирующего спондилоартрита). Исследование выявило молекулярные мимики, которые были экспериментально подтверждены как активаторы Т-клеток, связанных с данным заболеванием. Особую значимость представляет обнаружение пептида, обогащенного у пациентов с воспалительными заболеваниями кишечника (IBD), что указывает на общие микробные триггеры этих патологий. Разработка открывает новые возможности для рационального проектирования иммунотерапии и изучения антигенных драйверов аутоиммунных процессов.
В исследовании представлен масштабный унифицированный датасет пространственной транскриптомики, полученный с помощью платформы Stereo-seq. Авторы проанализировали 10 различных органов мыши, включая мозг, почки, легкие, тимус, кишечник, кожу, селезенку, яичники, семенники и матку, охватив 23 среза тканей на 21 чипе. Каждая выборка сопровождается соответствующими изображениями окрашивания ssDNA или гематоксилином и эозином (H&E). Датасет включает матрицы экспрессии с разрешением на уровне отдельных клеток (cell-bin) или квадратных бинов размером 50 мкм (bin-50), а также аннотации типов клеток. Исследование подтвердило надежность аннотаций через согласованность данных в разных срезах тканей и соответствие каноническим паттернам экспрессии маркерных генов. Сравнение показало преимущество разрешения cell-bin для точной аннотации типов клеток. Данный ресурс служит стандартизированной базой для разработки новых методов пространственной транскриптомики, бенчмаркинга и мультимодального анализа с применением глубокого обучения.
Исследователи представили TopicVI — инновационную глубокую интерпретируемую модель, предназначенную для анализа данных секвенирования РНК единичных клеток (scRNA-seq) и пространственной транскриптомики. В отличие от традиционных методов, полагающихся на жестко заданные биологические априорные знания, TopicVI использует теорию оптимального транспорта для гибкого совмещения существующих генных программ с наблюдаемыми данными. Это позволяет модели обнаруживать специфические для конкретного контекста (например, при болезнях) изменения в экспрессии генов, которые часто упускаются стандартными методами кластеризации. Бенчмаркинг показал, что TopicVI превосходит существующие аналоги по показателям биологической консервативности, коррекции пакетных эффектов (batch correction), связности тем и способности идентифицировать редкие типы клеток. При применении модели к наборам данных глиобластомы удалось выявить генные программы, связанные с регуляцией клеточного цикла и сигнализацией EGFR, что позволило обнаружить конвергентные состояния опухоли при различных лекарственных воздействиях. Данная разработка значительно расширяет возможности интерпретации сложных транскриптомных данных для понимания терапевтических механизмов.
Исследователи представили DIANA — многозадачную нейронную сеть, предназначенную для автоматизации анализа метаданных в области древней метагеномики. В отличие от традиционных методов, зависящих от референсных баз данных, DIANA предсказывает ключевые категории метаданных непосредственно на основе обилия унитигов. Модель была обучена на колоссальном массиве данных, включающем 2 597 регистраций с общим объемом собранных последовательностей 1,72 Тб. В ходе тестирования система продемонстрировала высокую точность: идентификация хозяина образца составила 94,6%, определение типа сообщества — 90,0%, а типа материала — 88,9%. Важной инновацией является способность к семантической генерализации, позволяющая корректно классифицировать даже те образцы, подтипы которых не встречались в обучающей выборке. Данная технология значительно ускоряет процессы валидации метаданных и контроля качества, что критически важно для масштабных исследований древних микробиомов.
В исследовании представлен новый инструмент immunotype — ансамблевый предиктор на базе глубокого обучения, предназначенный для прямого типирования аллелей HLA класса I по данным иммунопептидомики. Методология объединяет трансформерные энкодеры и графовые нейронные сети (GNN) для интеграции информации о последовательностях пептидов и HLA, дополняя их курируемым моноаллельным справочником предпочтений связывания пептидов. Разработка решает критическую проблему многоаллельной сложности, когда масс-спектрометрические данные отражают совокупную презентацию пептидов несколькими аллелями сразу. Согласно результатам тестирования, immunotype демонстрирует точность 87,2% на уровне белка в различных типах тканей. Данная технология позволяет проводить быстрое и экономически эффективное типирование HLA в крупномасштабных наборах данных, что имеет решающее значение для развития Т-клеточной иммунотерапии и персонализированной медицины.
В статье представлена гибридная нейросетевая архитектура (HDNN) для классификации нейродегенеративных заболеваний на основе данных МРТ. Использование методов ConvNeXt, MaxViT и механизмов Cross-Fusion Attention позволило достичь точности 97,4%, а применение Grad-CAM++ обеспечивает интерпретируемость результатов для клинического применения.
Исследователи представили Halo — инновационную предобученную модель, предназначенную для решения критической проблемы пространственной транскриптомики: точной сегментации границ целых клеток при наличии только изображений ядер. Методология Halo основана на интеграции морфологии ядер с пространственным распределением РНК-транскриптов, где координаты транскриптов преобразуются в карты молекулярной плотности. Эти карты обрабатываются совместно с DAPI-изображениями с использованием архитектуры сегментации Cellpose-SAM. Модель прошла предварительное обучение на мультимодальных данных Xenium, охватывающих 12 различных типов тканей, что позволяет использовать её напрямую на новых наборах данных без необходимости дополнительного обучения. Результаты показывают, что Halo значительно превосходит стандартную стратегию «расширения ядер» (nuclear expansion), обеспечивая более высокое соответствие истинным границам клеток и точность назначения РНК конкретным клеткам. Применение Halo позволяет получать более надежные данные для идентификации типов клеток и точной оценки их морфологических признаков, делая процесс сегментации масштабируемым и воспроизводимым.
GE HealthCare получила одобрение FDA для True Definition DL — нового решения на базе глубокого обучения для реконструкции изображений в компьютерной томографии (КТ). Технология обеспечивает высокую четкость и разрешение снимков, что критически важно для диагностики заболеваний легких, опорно-двигательного аппарата и внутреннего уха.
В исследовании, опубликованном в журнале npj Digital Medicine, представлена инновационная методика автоматизированной классификации подтипов немелкоклеточного рака легкого (НМРЛ) без использования традиционных методов окрашивания. Авторы разработали систему на базе глубокого обучения, которая способна выполнять «виртуальное иммуногистохимическое окрашивание» (virtual IHC) непосредственно на стандартных гистологических препаратах. Основная цель метода заключается в замене дорогостоящих и трудоемких химических процессов цифровой имитацией экспрессии специфических биомаркеров. Использование нейросетевых алгоритмов позволяет с высокой точностью определять молекулярные характеристики опухоли, что критически важно для выбора таргетной терапии. Технология демонстрирует потенциал для значительного ускорения патоморфологической диагностики и снижения операционных расходов медицинских лабораторий. Данный подход открывает новые возможности для персонализированной онкологии, позволяя проводить глубокий анализ тканей в режиме реального времени.
В исследовании представлен FLASH — инновационный интерпретируемый фреймворк на базе глубокого обучения, который работает напрямую с необработанными данными секвенирования. В отличие от традиционных GWAS, FLASH способен предсказывать фенотипы для генетических вариантов, которые не встречались в процессе обучения, и эффективно интегрировать структурные вариации. Тестирование на более чем 35 000 изолятов бактерий, грибков и вирусов показало, что метод достигает высокой точности, сопоставимой или превосходящей существующие специализированные решения (SOTA). Алгоритм позволяет идентифицировать канонические мишени для лекарственных препаратов ab initio и находить новые пан-видовые предикторы вирулентности, даже если они не аннотированы в базах данных NCBI. Особую значимость представляет способность FLASH предсказывать такие сложные характеристики, как диапазон хозяев бактериофагов, что ранее считалось невозможным методами GWAS. Данная технология открывает новые горизонты в прогнозировании функций генов и фенотипов во всем древе жизни, особенно в условиях ограничений биоэтики и высокой генетической сложности патогенов.