В исследовании представлена новая архитектура CBA-TransNet, объединяющая ResNet50 и Vision Transformer (ViT) для диагностики рака полости рта. Использование механизма внимания CBAM позволило достичь точности классификации 98,97%, эффективно сочетая извлечение локальных и глобальных признаков на гистопатологических снимках.
Разработана гибридная мультимодальная нейросеть, сочетающая классические CNN и квантовые вариационные схемы для диагностики болезни Паркинсона по рисункам спиралей и клиническим данным. Модель показала высокую точность (до 97.28%) и обеспечивает интерпретируемость результатов с помощью Grad-CAM и анализа чувствительности.
Разработан мультимодальный ИИ-фреймворк, объединяющий гистопатологические изображения и клинические данные для диагностики рака эндометрия. Модель демонстрирует высокую точность (AUC 0.95), обеспечивая при этом интерпретируемость результатов и защиту конфиденциальности данных пациентов.
В данном исследовании, опубликованном в журнале npj Digital Medicine, проводится сравнительный анализ эффективности системы искусственного интеллекта и профессиональных экспертов в задаче классификации лейкоцитов. Методология исследования заключалась в сопоставлении автоматизированных результатов работы ИИ с оценками 15 высококвалифицированных специалистов в области морфологии крови. Основная цель работы — определить, может ли алгоритм достичь уровня точности, сопоставимого с человеческим экспертным мнением, при анализе сложных клеточных структур. Ключевые результаты демонстрируют потенциал ИИ в автоматизации рутинных процессов гематологического анализа, что критически важно для снижения нагрузки на лаборатории. Исследование подчеркивает значимость внедрения подобных систем для стандартизации диагностики и минимизации субъективных ошибок при интерпретации мазков крови. Данная работа имеет высокую практическую ценность для цифровой гематологии и автоматизированных систем лабораторной диагностики.
В исследовании, опубликованном в журнале npj Digital Medicine, представлена инновационная методология использования визуально-языковых моделей (VLM) для глубокого анализа легочных узлов. Авторы предлагают подход «graphicalized vision-language modeling», который объединяет визуальные признаки КТ-снимков с текстовыми описаниями для более точной интерпретации патологий. Данная модель направлена на автоматизацию процесса обнаружения узлов и, что более важно, на эффективную стратификацию рисков злокачественности. Использование графических структур позволяет нейросети лучше понимать пространственные взаимосвязи между компонентами узла и окружающими тканями. Внедрение подобных систем в клиническую практику может значительно снизить нагрузку на радиологов и повысить точность ранней диагностики рака легких. Результаты демонстрируют потенциал интеграции мультимодальных данных для создания более надежных систем поддержки принятия врачебных решений в онкологии.
В статье представлена гибридная нейросетевая архитектура (HDNN) для классификации нейродегенеративных заболеваний на основе данных МРТ. Использование методов ConvNeXt, MaxViT и механизмов Cross-Fusion Attention позволило достичь точности 97,4%, а применение Grad-CAM++ обеспечивает интерпретируемость результатов для клинического применения.
GE HealthCare получила одобрение FDA для True Definition DL — нового решения на базе глубокого обучения для реконструкции изображений в компьютерной томографии (КТ). Технология обеспечивает высокую четкость и разрешение снимков, что критически важно для диагностики заболеваний легких, опорно-двигательного аппарата и внутреннего уха.
В исследовании, опубликованном в журнале npj Digital Medicine, представлена инновационная методика автоматизированной классификации подтипов немелкоклеточного рака легкого (НМРЛ) без использования традиционных методов окрашивания. Авторы разработали систему на базе глубокого обучения, которая способна выполнять «виртуальное иммуногистохимическое окрашивание» (virtual IHC) непосредственно на стандартных гистологических препаратах. Основная цель метода заключается в замене дорогостоящих и трудоемких химических процессов цифровой имитацией экспрессии специфических биомаркеров. Использование нейросетевых алгоритмов позволяет с высокой точностью определять молекулярные характеристики опухоли, что критически важно для выбора таргетной терапии. Технология демонстрирует потенциал для значительного ускорения патоморфологической диагностики и снижения операционных расходов медицинских лабораторий. Данный подход открывает новые возможности для персонализированной онкологии, позволяя проводить глубокий анализ тканей в режиме реального времени.
В исследовании AI-REACT оценивалось влияние ИИ-инструмента qER EU 2.0 на точность, скорость и уверенность врачей при анализе КТ головного мозга без контраста (NCCTH). В ретроспективном анализе приняли участие 30 специалистов (рентгенологи, врачи скорой помощи и рентген-лаборанты), оценивших 150 сканов, из которых 98 содержали критические патологии. Результаты показали, что использование ИИ повысило общую чувствительность при выявлении критических аномалий с 82,8% до 89,7% (+6,9%), а чувствительность к внутричерепным кровоизлияниям выросла с 84,6% до 91,6% (+7,0%). При этом наблюдалось снижение специфичности с 84,5% до 78,9% (-5,5%). Важным практическим выводом стало то, что врачи отделений неотложной помощи при поддержке ИИ достигли уровня чувствительности, сопоставимого с квалифицированными рентгенологами. Исследование подтверждает высокий потенциал ИИ в повышении диагностической эффективности неспециализированного медицинского персонала в экстренных ситуациях.
Представлена инновационная мультиагентная платформа SpineAgent, предназначенная для автоматизированной генерации медицинских заключений по МРТ позвоночника. В основе системы лежит мультипоследовательная базовая модель, обученная на колоссальном массиве данных: 32 047 пациентах, 453 683 сериях МРТ и более 13,4 миллионах срезов. Методология включает предварительное обучение двух кодировщиков на базе DINOv3 для T1- и T2-взвешенных последовательностей с последующим использованием стратегии непрерывного обучения для синтеза единых эмбеддингов пациента. SpineAgent демонстрирует превосходство над существующими методами, показывая улучшение среднего показателя AUROC на 10,8% в 17 задачах прогнозирования патологий позвоночника. Система не только классифицирует заболевания, но и локализует патологические области, а также поддерживает мультимодальный поиск изображений и отчетов. Архитектура включает 37 специализированных агентов, чьи результаты интегрируются в медицинский агент для формирования структурированного и интерпретируемого отчета. Экспертная оценка пятью рентгенологами подтвердила лидирующую эффективность системы в задачах генерации клинически обоснованных описаний.
В исследовании представлен TMEformer — инновационный фреймворк глубокого обучения, специально разработанный для анализа опухолевого микроокружения с учетом пространственного контекста. В отличие от существующих моделей, TMEformer использует данные пространственной транскриптомики высокого разрешения для совместного моделирования программ опухолевых клеток и сигналов локального микроокружения. Методология позволяет проводить виртуальные пертурбации (in silico), что дает возможность моделировать функциональные зависимости внутри клеточных экосистем. Валидация на различных когортах показала, что модель превосходит базовые предобученные системы в прогнозировании ключевых переходов, таких как пластичность клеточных линий и возникновение резистентности к терапии. В ходе систематического анализа были выявлены как известные регуляторы, так и новые потенциальные мишени среди транскрипционных факторов и лигандов микроокружения. Использование TME-эмбеддингов значительно улучшает пространственную стратификацию опухолевых клеток, обеспечивая высокую точность соответствия патологической архитектуре тканей.
В исследовании представлена инновационная платформа Sipobe-PPA, предназначенная для решения критической проблемы дизайна белков и антител: отделения реальных связывающих молекул от структурных «галлюцинаций», создаваемых генеративными моделями. Авторы предложили методологию, которая рассматривает белковые интерфейсы как псевдо-лиганды и оценивает их через силовое поле на базе ИИ, обученное исключительно на взаимодействиях малых молекул. Такой zero-shot подход позволяет избежать проблем утечки данных и запоминания, характерных для моделей, обучаемых непосредственно на белковых комплексах. Для учета структурной пластичности используется стратегия конформационного ансамбля, вычисляющая оценки взаимодействия на основе множественных структурных состояний, предсказанных AlphaFold3. В ходе тестирования на наборах данных Bindcraft, Boltzgen и Germinal система показала впечатляющий результат: в сценарии, имитирующем лабораторные условия, Sipobe-PPA достигла 80% показателя Hit Rate (доля попаданий) среди топ-5 прогнозов. Для сравнения, традиционные физические методы, такие как Rosetta-dG, показали нулевую эффективность в аналогичных условиях. Данная разработка значительно сокращает разрыв между вычислительным дизайном и успешным экспериментальным подтверждением в «мокрой» лаборатории.
Исследователи представили OmniGene-4 — унифицированную фундаментальную био-языковую модель, построенную на архитектуре Mixture-of-Experts (MoE) базе Gemma-4-26B-A4B. Модель была обучена путем расширения словаря 28 028 биологическими токенами (ДНК, белки, вторичные структуры) и продолжения предобучения (CPT) на массиве данных объемом 32,5 ГБ. В ходе тестирования версия v3 показала точность 99,95% на стандартных тестах гомологии белков BioPAWS и 93,66% на вопросах базы знаний BixBench, что значительно превосходит базовую модель (прирост +14,5% и +6,7% соответственно). Особое внимание в работе уделено интерпретируемости: авторы проанализировали, как этапы обучения меняют маршрутизацию экспертов. Было установлено, что этап CPT преимущественно перестраивает средние слои трансформера (L_11–L_22), в то время как SFT влияет на финальные слои, обеспечивая выравнивание выходных данных. На уровне токенов выявлены специализированные эксперты, отвечающие за конкретные модальности, такие как нуклеотиды ДНК и аминокислоты, что подтверждает эффективность разделения знаний внутри модели.
Noah Labs Vox — алгоритм на основе анализа голоса, обнаруживающий ухудшение сердечной недостаточности за недели до госпитализации, получил одобрение FDA Breakthrough Device Designation. Технология использует машинное обучение для анализа голосовых изменений, что позволяет неинвазивно мониторить пациентов с сердечной недостаточностью на основе 5-секундных записей голоса.
В статье представлен FairGen — инновационный метод на основе диффузионных моделей, разработанный для решения проблемы демографического смещения при синтезе медицинских изображений. Исследователи внедрили механизм выравнивания предпочтений (preference-alignment), который позволяет генерировать высокореалистичные медицинские данные, сохраняя при этом справедливость в отношении различных демографических групп (пол, возраст, этническая принадлежность). Методология направлена на устранение систематических ошибок, которые часто возникают в обучающих выборках и приводят к снижению точности диагностики для определенных групп населения. Результаты показывают, что FairGen значительно улучшает репрезентативность синтетических наборов данных, обеспечивая высокое качество визуализации, сопоставимое с реальными снимками. Использование данного подхода критически важно для создания сбалансированных датасетов, на которых обучаются диагностические системы ИИ, что напрямую влияет на минимизацию медицинских ошибок и обеспечение равного качества медицинской помощи для всех пациентов. Технология открывает новые возможности для обучения нейросетей в условиях дефицита специфических клинических данных.
В данном обзоре представлены ключевые события недели, связанные с внедрением искусственного интеллекта в медицинскую практику. Основное внимание уделено разработке новых российских государственных стандартов (ГОСТ) для медицинских систем на базе больших генеративных моделей, что критически важно для легализации ИИ-решений. В европейском сегменте зафиксировано одобрение нового ИИ-устройства, предназначенного для высокоточной диагностики рака кожи. Также рассматривается инновационная технология от Google, позволяющая проводить неинвазивный мониторинг пульса, используя только камеру смартфона. Важной частью дайджеста является юридическая дискуссия о распределении ответственности между разработчиками и врачами при возникновении ошибок в работе медицинских алгоритмов. Обзор охватывает как технологические прорывы, так и вопросы нормативно-правового регулирования отрасли.
В исследовании представлен инновационный конвейер QSAR-моделирования, использующий графовые нейронные сети (GNN) и графовые трансформеры (GT) для прогнозирования токсичности химических соединений. Авторы разработали методологию, которая кодирует молекулы напрямую в виде графов, избегая потери информации, характерной для бинарных фингерпринтов. Модель тестировалась на данных PubChem для оценки активации каспаз-3/7 и изменения митохондриального мембранного потенциала (MMP), а также на данных FDA для прогнозирования лекарственного поражения печени (DILI) у человека. Результаты показали значительный прогресс: консенсусная модель достигла AUC 0.69 при прогнозировании DILI, а архитектура Graphormer показала лучший F1-score 0.79, существенно превзойдя предыдущие показатели (AUC 0.63 и F1 0.65). Механистический анализ выявил, что фенольные соединения с пара-гидроксифенильным мотивом и липофильные соединения с длинными алкильными цепями провоцируют коллапс MMP и последующую активацию каспаз. Исследование подчеркивает потенциал глубокого обучения на графах для ускорения оценки безопасности новых лекарственных средств и химических веществ.
Технологический гигант Nvidia объединил усилия со стартапом Abridge для создания специализированной базовой модели искусственного интеллекта, предназначенной для обработки клинических разговоров. Основная цель проекта заключается в автоматизации документирования медицинских консультаций, что позволит врачам сосредоточиться на пациентах, а не на заполнении электронных медицинских карт. В рамках сотрудничества будут использоваться вычислительные мощности Nvidia для обучения моделей, способных с высокой точностью интерпретировать сложную медицинскую терминологию и нюансы диалогов между врачом и пациентом. Разработка направлена на решение проблемы выгорания медицинского персонала, вызванного административной нагрузкой. Ожидается, что внедрение такой специализированной модели значительно повысит точность структурирования данных в медицинских записях по сравнению с универсальными языковыми моделями. Данная инициатива является важным шагом в интеграции генеративного ИИ непосредственно в клиническую практику.
Исследование представляет ActiTect — инновационный программный конвейер на базе машинного обучения, разработанный для автоматизированного скрининга расстройства поведения в фазе быстрого сна (RBD). Методология исследования опирается на использование стандартизированной актиграфии, что позволяет перенести процесс диагностики из специализированных лабораторий сна в условия домашнего мониторинга. Система анализирует паттерны движения пациента, используя алгоритмы глубокого обучения для выявления специфических признаков RBD. Ключевой особенностью ActiTect является его высокая обобщающая способность, позволяющая эффективно работать на различных наборах данных без потери точности. Внедрение данного решения может значительно повысить доступность ранней диагностики нейродегенеративных заболеваний, связанных с RBD, за счет снижения нагрузки на клинический персонал и стоимости обследований. Результаты демонстрируют потенциал автоматизации рутинного скрининга с использованием носимых устройств.
В исследовании рассматривается двойственная природа вероятностного моделирования последовательностей и сжатия данных, где языковые модели используются как инструмент оценки качества генеративного моделирования ДНК. Авторы представили семейство из десяти моделей DNAGPT2 (архитектура GPT-2-small), предобученных на мультивидовом корпусе DNABERT2 с использованием одной видеокарты A40. Ключевым достижением стало достижение показателя 1.47 бит на основание (bpb) при сжатии генома человека T2T, что заняло четвертое место в бенчмарке Cobilab и превзошло все универсальные компрессоры общего назначения. Исследование выявило, что стандартная для NLP токенизация может быть неоптимальной для ДНК: словарь BPE размером в 32 токена показал лучшие результаты, чем более крупные словари. Также было обнаружено, что модели с коротким контекстом, использующие BPE, могут превосходить специализированные геномные модели с длинным контекстом из-за различий в архитектуре и данных. В завершение авторы создали карту информационной плотности генома человека, продемонстрировав статистически значимые различия в профилях информации между экзонами, интронами, межгенными участками и повторами Alu.