Обзор посвящен развитию систем Med-VQA, которые переходят от простых текстовых баз данных к сложным мультимодальным архитектурам на базе LLM и VLM. Исследование подчеркивает эффективность генеративных моделей, методов RAG и цепочек рассуждений (CoT) в анализе радиологических, патологических и дерматологических изображений.
В статье исследуются критические уязвимости и вызовы безопасности, возникающие при использовании мультиагентных систем на основе больших языковых моделей (LLM) в различных предметных областях. Авторы выделяют семь ключевых проблем, связанных с взаимодействием агентов, которые могут привести к компрометации данных или некорректному выполнению задач при переходе между доменами. Основное внимание уделяется рискам, возникающим в процессе обмена контекстом и инструментами между специализированными агентами. Исследование подчеркивает необходимость разработки новых протоколов безопасности и методов изоляции для предотвращения несанкционированного доступа и манипуляций в сложных ИИ-экосистемах. Результаты работы имеют важное значение для разработчиков архитектур ИИ, стремящихся к созданию надежных и безопасных автономных систем. Данная работа закладывает теоретическую основу для защиты мультиагентных сред от атак типа 'prompt injection' и междоменных утечек.
Исследователи представили PHI-Reason — инновационный фреймворк для прогнозирования взаимодействий между бактериофагами и их хозяевами (PHI) на уровне видов. В отличие от традиционных методов, использующих числовые векторы сходства последовательностей или состава геномов, PHI-Reason переформулирует задачу как процесс логического вывода на основе биологических текстов. Система преобразует гетерогенные данные (геномы фагов и хозяев, функциональные аннотации, результаты гомологического поиска и метаданные) в модульные текстовые профили. Затем замороженная большая языковая модель (LLM) ранжирует потенциальных хозяев, интегрируя эти доказательства непосредственно во время инференса. Тестирование на бенчмарках показало, что PHI-Reason демонстрирует конкурентоспособную точность и находит правильные соответствия, которые упускают классические методы. Ключевым преимуществом является интерпретируемость: метод позволяет анализировать, на каких именно биологических фактах основан прогноз, и измерять риск галлюцинаций ИИ при неполных данных. Это делает технологию важным инструментом для микробиомной инженерии и глубокого понимания микробной экологии.
В исследовании представлен CAREPath — инновационный фреймворк на базе архитектуры KG-LLM (Knowledge Graph + Large Language Model), предназначенный для поиска новых терапевтических применений существующих лекарственных средств. Авторы решают проблему неэффективности глубокого обхода биомедицинских графов знаний, когда длинные пути через «гены-хабы» создают избыточный шум. Методология сочетает в себе два подхода: DFS-подобный модуль для извлечения коротких, семантически значимых путей «болезнь-ген-препарат» и BFS-подобный модуль для обогащения контекста через соседства генов и фармакологическое сходство. В ходе экспериментов на пяти биомедицинских графах знаний CAREPath превзошел 18 базовых моделей, показав прирост метрики AUPRC до 3,8%. Результаты подтверждают, что кодирование семантических коротких путей является ключевым фактором успеха, а механизм аугментации контекста повышает устойчивость модели при дефиците данных. Практическая значимость подтверждена кейс-стади и сопоставлением с недавно одобренными FDA показаниями, что делает систему интерпретируемым инструментом для разработки новых стратегий лечения.
Исследование, опубликованное в Nature Machine Intelligence, рассматривает проблему гетерогенности психиатрических расстройств и сложности интерпретации неструктурированных лонгитюдных данных, что часто ведет к вариативности в клинической практике. Ученые представили специализированную большую языковую модель (LLM), разработанную именно для нужд психиатрии, которая призвана помочь врачам в стандартизации процесса диагностики и лечения. Методология исследования фокусируется на анализе текстовых нарративов пациентов, которые традиционно сложно поддаются автоматизированной обработке. Ключевым результатом является демонстрация того, что использование данной LLM позволяет снизить субъективность оценок и обеспечить более последовательное, высококачественное оказание медицинской помощи. Внедрение подобных ИИ-инструментов может значительно повысить точность интерпретации динамики состояния пациента во времени. Данная разработка имеет критическое значение для цифровой трансформации психиатрической помощи и внедрения доказательных стандартов в клиническую практику.
В исследовании, опубликованном в журнале npj Digital Medicine, оценивается потенциал использования больших языковых моделей (LLM) для оптимизации процесса получения информированного согласия от пациентов в рамках клинических испытаний. Авторы анализировали способность ИИ интерпретировать сложные медицинские протоколы и преобразовывать их в доступный для пациентов формат, сохраняя при этом юридическую и клиническую точность. Методология включала сравнение ответов LLM с ответами медицинских экспертов на вопросы участников исследования. Результаты показали, что современные модели способны демонстрировать высокую степень соответствия стандартам информированного согласия, значительно сокращая время на разъяснение процедур. Применение ИИ в этом аспекте может снизить когнитивную нагрузку на пациентов и минимизировать риск ошибок при интерпретации условий участия. Данная работа подчеркивает важный шаг в автоматизации административных и коммуникационных процессов в клинической практике с помощью генеративного ИИ.
В данной статье представлены результаты рандомизированного контролируемого исследования (RCT), направленного на изучение эффективности функции Guided Learning на базе модели Gemini. Исследование проводилось в Сьерра-Леоне с целью оценки того, как персонализированное ИИ-обучение влияет на вовлеченность и скорость усвоения знаний учащимися. Основной акцент сделан на потенциале использования больших языковых моделей для преодоления образовательных барьеров в развивающихся регионах. Результаты демонстрируют, что внедрение инструментов Guided Learning способствует значительному росту вовлеченности студентов в учебный процесс. Методология RCT позволяет подтвердить прямую корреляцию между использованием ИИ-ассистента и ускорением темпов обучения. Данная работа имеет важное значение для понимания того, как ИИ может масштабировать качественное образование и поддерживать когнитивное развитие в условиях ограниченных ресурсов.
В статье рассматривается критическая проблема современного медицинского ИИ: разрыв между высокой производительностью моделей и их клинической обоснованностью. Авторы утверждают, что текущие методы объяснимого ИИ (XAI) и post-hoc интерпретации недостаточны для преодоления эпистемического разрыва между поведением алгоритма и обоснованными медицинскими заключениями. Вместо акцента на интерпретируемость, исследователи предлагают переход к модели управления на основе проверяемости (testability). Основные рекомендации включают проведение пререгистрированных эмпирических испытаний для проверки причинно-следственного соответствия и устойчивости моделей к изменениям оборудования (сканеров), локаций и подгрупп пациентов. Также предлагается концепция «Институционального ИИ», которая подразумевает обязательный аудит происхождения данных, проспективную валидацию, внешние проверки и использование состязательных (adversarial) методов оценки для больших языковых моделей (LLM). Данный подход направлен на минимизацию использования алгоритмами «коротких путей» (shortcuts) и обеспечение безопасности клинического применения.
Исследование оценивает способность ведущих LLM (включая Gemini и Grok) отвечать на вопросы пациентов о заболеваниях сердца. Результаты показали высокую точность и низкий уровень галлюцинаций, при этом Gemini была признана наиболее качественной моделью по совокупности факторов.
Исследование изучает использование LLM (таких как ChatGPT) среди студентов и преподавателей стоматологической школы UTHealth. Результаты показывают высокий уровень использования инструментов для обучения и письма, при этом преподаватели выражают острую потребность в специализированном обучении работе с ИИ.
Систематический обзор демонстрирует стремительный рост использования ИИ в обучении студентов-медиков, особенно через виртуальных пациентов на базе LLM. Основные направления включают симуляцию клинического мышления, оценку навыков OSCE и обучение работе с электронными медицинскими картами.
Исследование оценивает способность пяти современных языковых моделей (включая GPT-5 и GPT-4o) решать клинические задачи, связанные с лечением болей в пояснице. Авторы выявили критические ошибки в безопасности и полноте ответов, а также доказали, что структурированный промпт-инжиниринг может значительно улучшить качество медицинских рекомендаций ИИ.
Исследование оценивает способность модели GPT-4o рекомендовать тип интраокулярной линзы (ИОЛ) на основе данных 74 пациентов. Результаты показали высокую точность при выборе монофокальных линз, но низкую эффективность в сложных случаях (трифокальные линзы), что указывает на необходимость дообучения модели.
Исследователи представили BacteReason — специализированную большую языковую модель (LLM), предназначенную для прогнозирования чувствительности бактерий к антибиотикам с предоставлением механистического обоснования. В отличие от традиционных методов машинного обучения, которые часто работают как «черный ящик», BacteReason использует подход обучения с учителем, где проприетарная модель-наставник генерирует объяснения молекулярных механизмов резистентности. Для обеспечения научной точности модель интегрирована с биомедицинскими базами знаний через протокол TogoMCP, что позволяет привязывать каждый шаг рассуждения к конкретным доказательствам из графов знаний. В ходе тестирования на бенчмарках по экстраполяции модель показала относительное улучшение точности на 43% по сравнению с базовой ненастроенной LLM и на 38% по сравнению с моделью, прошедшей тонкую настройку без использования рациональных обоснований. Данная разработка имеет критическое значение для клинической практики, так как позволяет врачам не только получать прогноз эффективности препарата, но и понимать биологическую причину устойчивости патогена.
Исследователи представили инновационный алгоритм KM-GPT-DCH, предназначенный для автоматизированного сравнения и оценки конкурирующих биомедицинских гипотез. Метод объединяет анализ совместной встречаемости терминов (co-occurrence) с возможностями больших языковых моделей (LLM) и использует байесовские методы для оценки уровня статистической уверенности. В ходе тестирования на исторических данных алгоритм продемонстрировал способность определять верную гипотезу с высокой степенью уверенности за несколько лет до того, как это было сделано научным сообществом. Авторы применили инструмент к 20 парам неразрешенных на данный момент противоречивых гипотез, предоставив вектор для будущих исследований. Практическая значимость метода заключается в возможности объективного анализа таких вопросов, как этиология депрессии (дефицит моноаминов против воспалительных процессов). Для широкого доступа реализована веб-версия алгоритма на платформе skim.morgridge.org, позволяющая визуализировать научные тренды.
На конференции SXSW26 эксперты обсудили влияние онлайн-сообществ и технологий искусственного интеллекта на путь пациента. Основное внимание было уделено взаимодействию между платформами вроде Reddit, где пациенты ищут поддержку, и развитием больших языковых моделей (LLM). Панельная дискуссия затронула критические аспекты доверия к медицинской информации в эпоху ИИ и потенциальные риски дезинформации. Участники проанализировали, как ИИ может как помогать структурировать пользовательский опыт, так и создавать новые вызовы для верификации данных. Исследование подчеркивает необходимость создания новых механизмов контроля качества контента в гибридных цифровых средах. Данная тема имеет высокую значимость для понимания будущего цифрового здравоохранения и взаимодействия врачей с пациентами через нетрадиционные каналы связи.
Данное исследование, опубликованное в журнале Artificial Intelligence in Medicine, посвящено критическому анализу способности больших языковых моделей (LLM) предоставлять точную и безопасную медицинскую информацию. В центре внимания находится процесс извлечения данных, касающихся специфических аспектов эпидуральной анестезии, что является критически важным для клинической практики. Авторы проводят сравнительный анализ различных архитектур моделей, проверяя их на предмет галлюцинаций, фактических ошибок и соответствия доказательной медицине. Методология включает оценку точности ответов на сложные клинические вопросы, где цена ошибки крайне высока. Результаты исследования ставят под сомнение прямую корреляцию между количеством параметров модели и качеством её медицинских ответов, указывая на то, что более компактные, но специализированные модели могут демонстрировать сопоставимую или даже превосходящую надежность. Работа подчеркивает необходимость внедрения строгих протоколов верификации для использования LLM в качестве инструментов поддержки принятия врачебных решений.
Исследование посвящено оценке способности новейшей мультимодальной большой языковой модели ChatGPT-5 предоставлять точную и полезную информацию по чувствительной урологической теме — вазэктомии. Методология включала анализ 10 наиболее популярных запросов из Google Trends, на которые модель давала ответы, оцениваемые панелью из восьми экспертов (урологов, специалистов по общественному здравоохранению, акушера-гинеколога и медсестры по репродуктивному здоровью). Эксперты оценивали ответы по шести критериям, включая медицинскую точность, полноту и ясность, по 5-балльной шкале Лайкерта. Результаты показали средние баллы в диапазоне от 3.75 до 4.04, при этом наиболее высокие оценки получили ясность языка и уместность тона. Однако была выявлена значительная вариативность в оценках медицинской точности и полноты данных, а коэффициент внутриклассовой корреляции (ICC) составил -0.01, что указывает на крайне низкую согласованность между экспертами. Авторы делают вывод, что, несмотря на высокую доступность и понятность ответов, использование LLM в качестве образовательного ресурса требует строгого экспертного контроля и адаптации под целевую аудиторию.
В данной статье рассматриваются сложные вопросы регулирования медицинского искусственного интеллекта на базе больших языковых моделей (LLM) в США. Основное внимание уделяется вызовам, которые LLM создают для традиционных регуляторных механизмов, поскольку их применение часто выходит за рамки стандартных определений медицинских изделий. В центре обсуждения — интервью с доктором Шантану Нунди, советником офиса Комиссара FDA по вопросам управления ИИ и политики в области цифрового здравоохранения. Исследование подчеркивает необходимость адаптации нормативной базы для охвата новых типов ИИ-инструментов, которые могут использоваться не только для диагностики, но и для поддержки принятия клинических решений и взаимодействия с пациентами. Эксперт анализирует, как FDA планирует балансировать между стимулированием инноваций и обеспечением безопасности пациентов в условиях быстрого развития генеративного ИИ. Работа представляет высокую значимость для понимания будущего правового поля в цифровой медицине.
В данной статье рассматриваются критические аспекты регулирования и надзора за медицинскими устройствами, использующими генеративный ИИ (GenAI) и большие языковые модели (LLM). В рамках интервью с доктором Шантану Нунди, советником офиса комиссара FDA по вопросам управления ИИ и цифровой политики здравоохранения, анализируется сложность контроля за новыми технологиями. Основная идея заключается в том, что надзор за GenAI выходит за рамки полномочий одного регулятора и требует тесной координации между государственными агентствами, системами здравоохранения и практикующими клиницистами. Статья подчеркивает необходимость создания комплексной экосистемы управления для обеспечения безопасности и эффективности ИИ-решений. Кроме того, эксперт дает практические рекомендации для разработчиков и инноваторов по продуктивному взаимодействию с FDA. Работа представляет высокую ценность для понимания регуляторного ландшафта в эпоху стремительного развития медицинских нейросетей.