В статье представлена гибридная нейросетевая архитектура (HDNN) для классификации нейродегенеративных заболеваний на основе данных МРТ. Использование методов ConvNeXt, MaxViT и механизмов Cross-Fusion Attention позволило достичь точности 97,4%, а применение Grad-CAM++ обеспечивает интерпретируемость результатов для клинического применения.
В исследовании представлен HiReS (High-Resolution Segmentation) — программный конвейер с открытым исходным кодом, предназначенный для автоматизации морфометрического анализа планктона. Основная проблема, которую решает метод, заключается в невозможности обработки полноразмерных изображений высокого разрешения стандартными методами глубокого обучения из-за ограничений оперативной памяти. Методология HiReS основана на разделении изображений на перекрывающиеся фрагменты (chunks), применении сегментации экземпляров на базе архитектуры YOLO, последующей реконструкции полигональных аннотаций в пространстве полного изображения и удалении дубликатов. Авторы протестировали систему на видах Daphnia pulex, Daphnia galeata и Simocephalus vetulus, показав, что автоматизированные измерения точно воспроизводят структуру распределения признаков, полученную вручную. Несмотря на выявленное систематическое положительное смещение (multiplicative scaling offset), после центрирования данных расхождения между автоматическим и ручным методами оказались минимальными. Важным практическим результатом является то, что при малых объемах выборки медианные значения, полученные моделью, могут превосходить точность ручных оценок. Данный инструмент представляет интерес для биомедицинских исследований и экологии, где требуется высокоточный количественный анализ микрообъектов.
Исследователи представили StriMap — единую платформу на базе глубокого обучения, предназначенную для высокоточного предсказания взаимодействий между Т-клеточными рецепторами (TCR), пептидами и молекулами HLA. В отличие от существующих методов, StriMap интегрирует физико-химические свойства, контекст последовательностей и структурные особенности интерфейсов распознавания, что позволяет моделировать сложные трехсторонние взаимодействия. В ходе тестирования платформа продемонстрировала передовые показатели точности (state-of-the-art) и высокую обобщающую способность. В качестве практического применения была проведена масштабная проверка 13 миллионов пептидов, полученных из 43 241 бактериального белка, в контексте болезни Бехтерева (анкилозирующего спондилоартрита). Исследование выявило молекулярные мимики, которые были экспериментально подтверждены как активаторы Т-клеток, связанных с данным заболеванием. Особую значимость представляет обнаружение пептида, обогащенного у пациентов с воспалительными заболеваниями кишечника (IBD), что указывает на общие микробные триггеры этих патологий. Разработка открывает новые возможности для рационального проектирования иммунотерапии и изучения антигенных драйверов аутоиммунных процессов.
В исследовании представлен масштабный унифицированный датасет пространственной транскриптомики, полученный с помощью платформы Stereo-seq. Авторы проанализировали 10 различных органов мыши, включая мозг, почки, легкие, тимус, кишечник, кожу, селезенку, яичники, семенники и матку, охватив 23 среза тканей на 21 чипе. Каждая выборка сопровождается соответствующими изображениями окрашивания ssDNA или гематоксилином и эозином (H&E). Датасет включает матрицы экспрессии с разрешением на уровне отдельных клеток (cell-bin) или квадратных бинов размером 50 мкм (bin-50), а также аннотации типов клеток. Исследование подтвердило надежность аннотаций через согласованность данных в разных срезах тканей и соответствие каноническим паттернам экспрессии маркерных генов. Сравнение показало преимущество разрешения cell-bin для точной аннотации типов клеток. Данный ресурс служит стандартизированной базой для разработки новых методов пространственной транскриптомики, бенчмаркинга и мультимодального анализа с применением глубокого обучения.
Исследователи представили TopicVI — инновационную глубокую интерпретируемую модель, предназначенную для анализа данных секвенирования РНК единичных клеток (scRNA-seq) и пространственной транскриптомики. В отличие от традиционных методов, полагающихся на жестко заданные биологические априорные знания, TopicVI использует теорию оптимального транспорта для гибкого совмещения существующих генных программ с наблюдаемыми данными. Это позволяет модели обнаруживать специфические для конкретного контекста (например, при болезнях) изменения в экспрессии генов, которые часто упускаются стандартными методами кластеризации. Бенчмаркинг показал, что TopicVI превосходит существующие аналоги по показателям биологической консервативности, коррекции пакетных эффектов (batch correction), связности тем и способности идентифицировать редкие типы клеток. При применении модели к наборам данных глиобластомы удалось выявить генные программы, связанные с регуляцией клеточного цикла и сигнализацией EGFR, что позволило обнаружить конвергентные состояния опухоли при различных лекарственных воздействиях. Данная разработка значительно расширяет возможности интерпретации сложных транскриптомных данных для понимания терапевтических механизмов.
Исследователи представили DIANA — многозадачную нейронную сеть, предназначенную для автоматизации анализа метаданных в области древней метагеномики. В отличие от традиционных методов, зависящих от референсных баз данных, DIANA предсказывает ключевые категории метаданных непосредственно на основе обилия унитигов. Модель была обучена на колоссальном массиве данных, включающем 2 597 регистраций с общим объемом собранных последовательностей 1,72 Тб. В ходе тестирования система продемонстрировала высокую точность: идентификация хозяина образца составила 94,6%, определение типа сообщества — 90,0%, а типа материала — 88,9%. Важной инновацией является способность к семантической генерализации, позволяющая корректно классифицировать даже те образцы, подтипы которых не встречались в обучающей выборке. Данная технология значительно ускоряет процессы валидации метаданных и контроля качества, что критически важно для масштабных исследований древних микробиомов.
В исследовании представлен новый инструмент immunotype — ансамблевый предиктор на базе глубокого обучения, предназначенный для прямого типирования аллелей HLA класса I по данным иммунопептидомики. Методология объединяет трансформерные энкодеры и графовые нейронные сети (GNN) для интеграции информации о последовательностях пептидов и HLA, дополняя их курируемым моноаллельным справочником предпочтений связывания пептидов. Разработка решает критическую проблему многоаллельной сложности, когда масс-спектрометрические данные отражают совокупную презентацию пептидов несколькими аллелями сразу. Согласно результатам тестирования, immunotype демонстрирует точность 87,2% на уровне белка в различных типах тканей. Данная технология позволяет проводить быстрое и экономически эффективное типирование HLA в крупномасштабных наборах данных, что имеет решающее значение для развития Т-клеточной иммунотерапии и персонализированной медицины.
Исследователи представили Halo — инновационную предобученную модель, предназначенную для решения критической проблемы пространственной транскриптомики: точной сегментации границ целых клеток при наличии только изображений ядер. Методология Halo основана на интеграции морфологии ядер с пространственным распределением РНК-транскриптов, где координаты транскриптов преобразуются в карты молекулярной плотности. Эти карты обрабатываются совместно с DAPI-изображениями с использованием архитектуры сегментации Cellpose-SAM. Модель прошла предварительное обучение на мультимодальных данных Xenium, охватывающих 12 различных типов тканей, что позволяет использовать её напрямую на новых наборах данных без необходимости дополнительного обучения. Результаты показывают, что Halo значительно превосходит стандартную стратегию «расширения ядер» (nuclear expansion), обеспечивая более высокое соответствие истинным границам клеток и точность назначения РНК конкретным клеткам. Применение Halo позволяет получать более надежные данные для идентификации типов клеток и точной оценки их морфологических признаков, делая процесс сегментации масштабируемым и воспроизводимым.
GE HealthCare получила одобрение FDA для True Definition DL — нового решения на базе глубокого обучения для реконструкции изображений в компьютерной томографии (КТ). Технология обеспечивает высокую четкость и разрешение снимков, что критически важно для диагностики заболеваний легких, опорно-двигательного аппарата и внутреннего уха.
В исследовании, опубликованном в журнале npj Digital Medicine, представлена инновационная методика автоматизированной классификации подтипов немелкоклеточного рака легкого (НМРЛ) без использования традиционных методов окрашивания. Авторы разработали систему на базе глубокого обучения, которая способна выполнять «виртуальное иммуногистохимическое окрашивание» (virtual IHC) непосредственно на стандартных гистологических препаратах. Основная цель метода заключается в замене дорогостоящих и трудоемких химических процессов цифровой имитацией экспрессии специфических биомаркеров. Использование нейросетевых алгоритмов позволяет с высокой точностью определять молекулярные характеристики опухоли, что критически важно для выбора таргетной терапии. Технология демонстрирует потенциал для значительного ускорения патоморфологической диагностики и снижения операционных расходов медицинских лабораторий. Данный подход открывает новые возможности для персонализированной онкологии, позволяя проводить глубокий анализ тканей в режиме реального времени.
В исследовании представлен FLASH — инновационный интерпретируемый фреймворк на базе глубокого обучения, который работает напрямую с необработанными данными секвенирования. В отличие от традиционных GWAS, FLASH способен предсказывать фенотипы для генетических вариантов, которые не встречались в процессе обучения, и эффективно интегрировать структурные вариации. Тестирование на более чем 35 000 изолятов бактерий, грибков и вирусов показало, что метод достигает высокой точности, сопоставимой или превосходящей существующие специализированные решения (SOTA). Алгоритм позволяет идентифицировать канонические мишени для лекарственных препаратов ab initio и находить новые пан-видовые предикторы вирулентности, даже если они не аннотированы в базах данных NCBI. Особую значимость представляет способность FLASH предсказывать такие сложные характеристики, как диапазон хозяев бактериофагов, что ранее считалось невозможным методами GWAS. Данная технология открывает новые горизонты в прогнозировании функций генов и фенотипов во всем древе жизни, особенно в условиях ограничений биоэтики и высокой генетической сложности патогенов.
Исследователи представили ProMaya — инновационную иерархическую многомасштабную архитектуру на базе Graph-transformer, предназначенную для идентификации белок-белковых взаимодействий (PPI). В отличие от существующих методов, ProMaya интегрирует комплексные данные: 3D-атомную геометрию, распределение электронной плотности, структуру и неупорядоченность остатков, а также сигнатуры поверхностной плотности массы и эмбеддинги из больших языковых моделей белков. В ходе масштабного тестирования на данных девяти различных видов и 47 ГБ экспериментально подтвержденных данных, система продемонстрировала среднюю точность выше 95%. Это на 12% превосходит показатели современных аналогов (SOTA). Особая значимость работы заключается в высокой интерпретируемости модели, которая использует атомную и языковую информацию для повышения точности поиска взаимодействий в любых биологических видах. Разработка ProMaya позволяет значительно сократить расходы на дорогостоящие лабораторные эксперименты за счет высокоточного компьютерного моделирования. Система доступна бесплатно для научного сообщества.
Исследование представляет собой разработку конвейера глубокого обучения для неинвазивного определения показателей крови путём анализа видеозаписей бульбарной конъюнктивы (белковой оболочки глаза). Методология основана на применении нейронных сетей для извлечения признаков из видеоизображений конъюнктивы, которые коррелируют с концентрацией различных компонентов крови. Исследование опубликовано в ведущем журнале npj Digital Medicine (Springer Nature) 8 апреля 2026 года, что подтверждает высокий уровень рецензирования и научной значимости работы. Технология потенциально позволяет избежать инвазивных процедур забора крови для рутинных анализов, что особенно актуально для педиатрии, пациентов с хроническими заболеваниями и в условиях ограниченных ресурсов. Разработка включает обучение модели на большом наборе данных видеозаписей конъюнктивы с сопоставленными результатами стандартных лабораторных анализов крови. Ключевое преимущество подхода — возможность проведения анализа в режиме реального времени с использованием доступных видеокамер, что открывает перспективы для интеграции в телемедицинские платформы и мобильные приложения. Значимость для клинической практики заключается в потенциальном снижении нагрузки на лабораторные службы и повышении доступности базовых диагностических тестов. Работа представляет собой пример применения компьютерного зрения в медицине для создания новых неинвазивных диагностических инструментов.
Представлен CoLa-VAE — новый глубокий генеративный фреймворк на основе вариационного автокодировщика (VAE), который явно интегрирует ограничения межклеточной коммуникации (CCC) в обучение латентных переменных. В отличие от существующих подходов, моделирующих клеточное состояние исключительно через внутреннюю экспрессию генов, метод использует динамическую регуляризацию графового лапласиана, полученную из парных взаимодействий лиганд-рецептор. Это позволяет разделить коммуникативную топологию от транскрипционной гетерогенности в рамках единой архитектуры. Исследователи продемонстрировали, что CoLa-VAE работает как метод-агностичный фреймворк, совместимый с различными определениями сигнальных путей. Метод последовательно превосходит современные аналоги в метриках структурной кластеризации и точности шумоподавления на гетерогенных платформах секвенирования. Применение метода позволяет более точно анализировать клеточные взаимодействия, что критически важно для понимания механизмов развития заболеваний, разработки таргетных терапий и персонализированной медицины. Технология может быть использована при исследовании опухолевой микроокружения, иммунных ответов и регенеративных процессов.
Исследование представляет разработку новой перенастраиваемой вычислительной модели BlueSTARR для предсказания регуляторных эффектов некодирующих генетических вариантов, которые сложно интерпретировать только по последовательности ДНК. Авторы обучали несколько глубоких нейросетевых моделей на данных целогеномных STARR-seq анализов из двух клеточных линий и одного режима лекарственного воздействия. Исследование выявило глобальный сигнатурный паттерн по всему геному человека, соответствующий очищающему отбору против вариантов как с потерей, так и с приобретением регуляторной функции, при этом обнаружена значительная тенденция к отбору против усиления функции цис-регуляторных элементов в закрытом хроматине. При тестировании на синтетических энхансерах с мотивами связывания транскрипционных факторов GR и AP-1 модель показала способность обучаться дистанционно-зависимым и зависящим от лечения паттернам связывания и активации репортерных генов. Результаты демонстрируют, что легкие, легко перенастраиваемые модели эффективны для выявления скрытых сигналов в новых экспериментальных данных. Авторы отмечают лишь умеренные различия в производительности между различными архитектурами глубокого обучения при обучении на одном типе данных, при этом даже для промышленных моделей остается значительный запас для улучшений.
Исследователи разработали новый AI-фреймворк OPTIMIS для решения проблемы управления сложными биологическими системами на разных масштабах. Методология объединяет дискретный стохастический алгоритм Гиллеспи для микромасштабной динамики рецепторов с непрерывными нелинейными дифференциальными уравнениями для макромасштабного поведения организма. Для достижения скорости, необходимой для глубокого обучения с подкреплением (RL), гибридная система сжимается в дифференцируемый суррогат Neural ODE, действующий как быстрый цифровой двойник. В качестве демонстрации концепции фреймворк применён к инженерной клеточной терапии, где агенты RL обучаются динамическим закрытым петлям лечения внутри суррогатной среды. Ключевой результат: отслеживание микроскопической непредсказуемой клеточной активности как раннего предупреждающего сигнала позволило ИИ непрерывно корректировать дозу препарата, предвосхищая и останавливая опасные иммунные реакции до их неконтролируемого развития. Вычислительное усовершенствование улучшило показатели успешного контроля до более чем 70% в высоко нестабильных симулированных фенотипах, что представляет собой значимый прорыв для персонализированной медицины. Практическая значимость: метод предоставляет общий фреймворк для адаптивного вмешательства в многомасштабные биологические системы, открывая путь к автоматизированному принятию клинических решений в реальном времени.
Исследование представляет метод CoMPLip (co-folding of membrane proteins and lipid molecules), который улучшает точность предсказания структуры мембранных белков с помощью глубокого обучения. Традиционные подходы к предсказанию структуры белков, включая AlphaFold 3, не учитывают явным образом молекулярное окружение, что особенно критично для мембранных белков, чья структура и взаимодействия сильно зависят от липидного окружения. CoMPLip решает эту проблему путём совместного фолдинга белков с липидными молекулами во время предсказания, заставляя липиды организовываться в бислои вокруг трансмембранных регионов, создавая реалистичную мембранную среду. Метод демонстрирует улучшения в предсказании позы лигандов, корректном разделении внеклеточных и внутриклеточных доменов, а также позволяет исследовать множественные конформационные состояния динамических транспортеров. Ключевое преимущество CoMPLip — обучение не требуется (training-free), что упрощает интеграцию в существующие рабочие процессы AlphaFold 3. Это имеет прямое значение для разработки лекарств, так как мембранные белки составляют около 60% всех мишеней для фармакологических препаратов, и точное понимание их структуры критично для дизайна эффективных терапевтических агентов.
Представлен MEIsensor — фреймворк глубокого обучения для обнаружения и классификации вставок мобильных элементов (MEI) в человеческом геноме на основе данных секвенирования длинными ридами. В отличие от традиционных подходов, опирающихся на выравнивание с библиотекой повторов, MEIsensor выполняет прямую аннотацию на основе последовательности для вставок Alu, LINE1 и SVA. Оценка на бенчмарках HGSVC с использованием HiFi-длинных ридов показала, что MEIsensor превосходит существующие инструменты по основным классам MEI при существенном улучшении вычислительной эффективности, особенно для структурно сложных вставок SVA. Ручная верификация подтвердила способность метода идентифицировать MEI в высокоповторяющихся геномных регионах, включая центромерные повторы высшего порядка, которые ранее отсутствовали в бенчмарк-наборах. Это исследование представляет собой важный шаг в развитии вычислительной геномики, где методы глубокого обучения позволяют преодолеть ограничения традиционных алгоритмов выравнивания. Инструмент может быть полезен для исследований наследственных заболеваний, связанных со структурными вариациями генома, и для персонализированной медицины. Однако в тексте не указаны конкретные числовые метрики точности или скорости, что ограничивает оценку практической значимости.
Исследование сравнивает федеративное обучение с централизованным для классификации доброкачественных и злокачественных поражений в маммографии на двух гетерогенных датасетах (плёночные и цифровые снимки). Результаты показывают, что федеративное обучение работает надёжно в однородных условиях, но демонстрирует снижение производительности при сильном сдвиге доменов между плёночными и цифровыми изображениями.
В статье представлен новый фреймворк для анализа интерпретируемости моделей глубокого обучения, основанный на формальном понятии семантики модели из философии науки. Авторы аргументируют, что интерпретируемость является лишь одним из аспектов семантики модели, а не её полным описанием. Исследование иллюстрирует предложенный фреймворк примерами из биомедицинской области, демонстрируя практическую применимость подхода. Работа подчеркивает критическую важность понимания не только того, как работают медицинские ИИ-модели, но и того, что именно они представляют в семантическом смысле. Это особенно актуально для клинической практики, где врачи должны доверять рекомендациям алгоритмов. Фреймворк позволяет систематически анализировать неявные семантические аспекты моделей, которые часто остаются скрытыми при стандартной интерпретации. Статья опубликована в Nature Machine Intelligence, что указывает на высокую научную значимость работы. Подход может способствовать более надежному внедрению ИИ в медицинские приложения за счет улучшения прозрачности и доверия к алгоритмам.