Представлена новая архитектура нейросети CA2PNet, предназначенная для высокоточной сегментации медицинских изображений. Модель использует модули пространственного внимания и прогрессивные расширенные свертки, демонстрируя превосходные результаты на датасетах Kvasir-SEG и BUSI.
Данное исследование посвящено критической проблеме вариативности человеческой разметки при создании обучающих выборок для моделей ИИ в цифровой патологии. Авторы анализируют методы семантической сегментации и предлагают использование вероятностного консенсуса для минимизации ошибок, вызванных субъективностью патологоанатомов. В работе исследуется корреляция между качеством аннотаций и точностью последующего обучения нейросетей. Методология включает оценку надежности нескольких экспертов и разработку алгоритма, позволяющего получить более точную «золотую стандартную» маску через вероятностное взвешивание мнений. Результаты подчеркивают, что учет неопределенности в данных сегментации значительно повышает устойчивость моделей к шуму в обучающих выборках. Это имеет решающее значение для внедрения ИИ в клиническую практику, где точность локализации патологических структур напрямую влияет на постановку диагноза.
Разработан новый метод глубокого обучения (на базе ResU-Net) для точного совмещения изображений кожи, полученных в разных спектрах (видимом, NIR и тепловом). Исследование представляет первый в своем роде набор данных из 155 триплетов изображений поражений кожи, подтвержденных дерматологами.
Исследователи из Google представили инновационную систему пассивного мониторинга сердечного ритма (PHRM), которая позволяет измерять частоту сердечных сокращений (ЧСС) и рассчитывать пульс в состоянии покоя, используя только фронтальную камеру смартфона. В отличие от традиционных методов, требующих ношения смарт-часов или специализированных датчиков, данная технология опирается на возможности компьютерного зрения и анализа микроскопических изменений цвета кожи. Результаты исследования, опубликованные в престижном журнале Nature, подтверждают высокую точность метода, что делает его потенциально доступным инструментом для массового мониторинга сердечно-сосудистого здоровья. Технология может значительно расширить возможности дистанционной диагностики и регулярного контроля состояния пациентов без дополнительных затрат на носимую электронику. Внедрение PHRM в повседневное использование смартфонов открывает новые горизонты для телемедицины и превентивной кардиологии.
В статье представлен инновационный метод EvoPS, предназначенный для оптимизации обучения моделей на основе полнослойных гистологических изображений (Whole Slide Images, WSI). Основная проблема анализа WSI заключается в их колоссальном размере, что требует выбора наиболее информативных фрагментов (патчей) для обучения. Авторы предлагают использовать эволюционный алгоритм для отбора патчей непосредственно в пространстве эмбеддингов, что позволяет значительно повысить эффективность использования вычислительных ресурсов. Методология EvoPS фокусируется на поиске наиболее репрезентативных признаков, минимизируя избыточность данных при сохранении диагностической ценности. Исследование демонстрирует, что такой подход позволяет достичь высокой точности классификации патологий при сокращении объема обрабатываемых данных. Данная разработка имеет критическое значение для цифровой патологии, ускоряя процесс обучения нейросетей и снижая требования к инфраструктуре при анализе сложных гистологических срезов.
Данный обзорный труд представляет собой комплексный анализ применения ИИ и роботизированных технологий в процессе медицинской реабилитации. Исследователи провели «зонтичный обзор» (umbrella review), охватывающий данные из биомедицинских и инженерных баз до сентября 2025 года, чтобы отделить ИИ-технологии (ML/DL) от просто технологически-ассистированных методов. Результаты показывают, что наиболее выраженный клинический эффект наблюдается при улучшении двигательной активности у пациентов после инсульта при использовании робототехники и VR. Однако авторы фиксируют значительное снижение точности моделей при переходе от разработки к реальному клиническому применению, особенно в области интерфейсов «мозг-компьютер» и компьютерного зрения для оценки движений. В области лучевой диагностики (радиомика/CNN) технологии ближе к внедрению, но требуют локальной калибровки. Основными барьерами остаются недостаток данных о долгосрочной приверженности пациентов, вопросы экономической эффективности и перекос в сторону высокодоходных стран при сборе данных, что ставит под угрозу справедливость распределения технологий.
Компании VisionLabs, специализирующаяся на технологиях компьютерного зрения, и платформа для видеокоммуникаций «МТС Линк» объявили о совместной разработке цифровых аватаров. Данная технология предназначена для использования в онлайн-выступлениях, позволяя создавать реалистичные визуальные образы спикеров. В основе решения лежат передовые алгоритмы компьютерного зрения, которые обеспечивают синхронизацию мимики и движений аватара с речью пользователя в реальном времени. Хотя основная направленность продукта — бизнес-коммуникации и обучение, технология имеет потенциал применения в телемедицине для дистанционных консультаций и виртуальных медицинских ассистентов. Внедрение подобных решений может повысить вовлеченность пациентов при использовании цифровых интерфейсов. Проект демонстрирует возможности интеграции ИИ в повседневные инструменты взаимодействия.
В статье представлен SurgWound-Bench — специализированный набор данных и методология оценки (бенчмарк) для проверки эффективности алгоритмов искусственного интеллекта в диагностике хирургических ран. Исследование направлено на решение проблемы нехватки стандартизированных данных для обучения нейросетей, способных распознавать осложнения после операций. Методология включает в себя создание структурированной базы изображений и метрик, позволяющих объективно сравнивать различные модели машинного обучения. Ключевым результатом является разработка инструмента, который позволяет оценить точность автоматизированного мониторинга состояния швов и ран. Данная разработка имеет высокую практическую значимость для интеграции ИИ в послеоперационный уход, позволяя снизить риск инфекций и ускорить процесс заживления за счет раннего обнаружения патологий.
В исследовании представлен Prostate-TriMod — инновационный тримодальный датасет для анализа рака предстательной железы, созданный для обучения мультимодальных моделей ИИ. Данный ресурс объединяет три типа данных: мультимасштабные виртуальные фрагменты H&E (разрешением от 224px до 2040px), пространственные карты тканей и текстовые описания, сгенерированные на основе данных единичных клеток. Использование платформы мультиплексной визуализации Cell DIVE позволило синхронизировать морфологический контекст с паттернами иммунной инфильтрации, идентифицируемыми с помощью моделей TOPAZ и CAT. Датасет включает критически важные клинические аннотации, такие как группы грейда (Grade Groups) и статус биохимического рецидива (BCR). Разработка Prostate-TriMod открывает новые возможности для создания ИИ-фреймворков, способных связывать гистологическую морфологию и иммунный контекст с реальными клиническими прогнозами. Этот инструмент станет важной базой для бенчмаркинга в области мультимодального обучения представлений и пространственного анализа тканей.
Исследователи представили Static2Dynamic — инновационный фреймворк, предназначенный для реконструкции динамических биологических процессов на основе набора статических изображений. Методология решает проблему невозможности непрерывного наблюдения за развитием тканей или прогрессированием заболеваний в реальном времени. Алгоритм работает в три этапа: восстановление непрерывного псевдовремени (pseudotime) в глубоком репрезентативном пространстве, обучение генеративной модели изображений и последующая реконструкция временно согласованных видеороликов. В ходе количественной валидации на двух масштабных наборах данных микроскопических видео, созданных специально для бенчмаркинга, метод продемонстрировал высокую точность сопоставления траекторий псевдовремени с реальной биологической динамикой. Технология позволяет моделировать прошлое и будущее состояния клеток, расширяя границы наблюдаемого пространства живых систем. Статическое изображение теперь может служить отправной точкой для симуляции полных траекторий развития, которые ранее были недоступны для прямой записи.
Исследование оценивает эффективность системы на базе ИИ для контроля выполнения упражнений при болях в шее. Результаты показали высокую валидность программы (IOC 0.86–1.00) и умеренную надежность при измерении точности и времени выполнения упражнений.
Компания Wheelies, подразделение робототехники корпорации ITG, представила инновационную концепцию NoGPS-технологий для автономных систем. Основная цель разработки заключается в устранении критической зависимости беспилотных аппаратов от сигналов спутниковой навигации, которые могут быть подавлены или недоступны в сложных условиях. Методология базируется на использовании передовых алгоритмов компьютерного зрения и сенсорной интеграции для локализации объекта в пространстве. Внедрение подобных решений позволит значительно повысить надежность автономного транспорта и роботов при работе в городских каньонах, туннелях и зонах радиоэлектронного противодействия. Данная технология имеет потенциал применения в логистике, доставке и мониторинге территорий, где стабильность навигации является ключевым фактором безопасности.
В исследовании, опубликованном в журнале npj Digital Medicine, представлена инновационная методика оценки биомеханических свойств роговицы для раннего выявления кератоконуса. Авторы предложили использовать архитектуру Video Swin Transformer — передовую нейросетевую модель, способную анализировать пространственно-временные паттерны в видеоданных. Методология включает многомасштабную валидацию, позволяющую сопоставить результаты ИИ с традиционными клиническими показателями. Ключевым результатом является высокая точность модели в дифференциации здоровых тканей от тканей с патологическими изменениями, что критически важно для пациентов группы риска. Применение данного ИИ-решения позволяет автоматизировать сложный процесс биомеханического анализа, повышая точность диагностики на ранних стадиях заболевания. Это открывает новые возможности для персонализированного мониторинга состояния роговицы в офтальмологической практике.
В исследовании представлен инновационный метод AUBADE-syn, предназначенный для автоматизированного обнаружения глаукомы с использованием глубокого обучения. Основная проблема, которую решают авторы — это критический дисбаланс классов в медицинских наборах данных, когда здоровых глаз значительно больше, чем пораженных. Для преодоления этого барьера методология включает использование синтетических изображений глазного дна, сгенерированных для расширения обучающей выборки. Предложенный ансамблевый подход позволяет повысить точность классификации и устойчивость модели к редким патологическим случаям. Результаты демонстрируют, что интеграция синтетических данных существенно улучшает диагностическую способность нейросетей в условиях ограниченности реальных клинических снимков. Данная разработка имеет высокую практическую значимость для офтальмологической диагностики, позволяя создавать более надежные ИИ-системы скрининга.
Исследование сравнивает эффективность девяти архитектур глубокого обучения (CNN и трансформеров) в диагностике рака молочной железы на датасете BreaKHis. Авторы внедряют строгий протокол кросс-валидации с учетом разделения по пациентам, чтобы исключить утечку данных, и приходят к выводу, что при правильной методологии различия в архитектурах моделей становятся незначительными.
Представлен MAPSeg — полностью самообучаемый метод сегментации полипов, не требующий размеченных данных и обучаемый на изображениях здоровой слизистой. Благодаря стратегии синтетической аугментации SIMPO и архитектуре с расширенной памятью, метод значительно превосходит существующие неконтролируемые подходы по метрикам IoU и DICE.
В статье предлагается гибридная архитектура CNN-BiLSTM для автоматизированной диагностики рака кожи на основе датасета HAM10000. Модель достигла точности 94,82%, эффективно сочетая извлечение пространственных признаков и анализ контекстуальных зависимостей, что делает её пригодной для использования в реальном времени.
Разработан модульный метод постобработки для снижения количества ложноположительных срабатываний при обнаружении детских переломов на рентгенограммах. Система использует поиск сложных отрицательных примеров и калиброванное слияние оценок, обеспечивая высокую точность (F1-score 0.88) и интерпретируемость через Grad-CAM.
Исследование предлагает новый метод классификации девяти типов поражений кожи с использованием архитектуры Vision Transformer (ViT) для извлечения признаков. Предложенный подход с применением контрастного растяжения и легковесного MLP показал точность обучения 98% и точность тестирования 93,22%.
В статье представлен новый метод классификации рака кожи, сочетающий глубокое обучение (архитектура DSRSENet) и фильтрацию классических признаков с помощью механизма SAMI. Использование метода оптимального выбора признаков (OFS) позволило достичь высокой точности обнаружения — до 95.66% на наборах данных HAM10000 и PAD_UFES_20.