мультимодальные модели

Новость9531 мая

В исследовании представлена инновационная модель мультимодального глубокого обучения TabulaTime, предназначенная для раннего прогнозирования острого коронарного синдрома (ОКС). Уникальность подхода заключается в интеграции двух различных типов данных: клинических показателей пациентов и экологических факторов окружающей среды, которые ранее редко учитывались в единой предиктивной модели. Методология исследования базируется на использовании нейронных сетей, способных обрабатывать разнородные временные ряды для выявления скрытых паттернов развития сердечно-сосудистых катастроф. Результаты демонстрируют значительное превосходство модели над традиционными методами статистического анализа и стандартными алгоритмами машинного обучения. Внедрение TabulaTime в клиническую практику может существенно повысить точность стратификации рисков и позволить врачам принимать более своевременные превентивные меры. Данная разработка открывает новые горизонты в персонализированной кардиологии, связывая физиологическое состояние человека с внешними факторами среды.

кардиология глубокое обучение мультимодальные модели+3

Artificial Intelligence in Medicine Оригинал

Новость9524 мая

В исследовании представлена SiCLIP — инновационная мультимодальная программная среда, разработанная специально для повышения точности диагностики силикоза. Методология базируется на использовании концепции CLIP (Contrastive Language-Image Pre-training), которая позволяет модели сопоставлять визуальные признаки рентгеновских снимков с текстовыми медицинскими описаниями. Ключевой особенностью SiCLIP является её высокая интерпретируемость (explainability), что критически важно для клинического применения, так как врачи могут понимать логику принятия решений нейросетью. Исследование демонстрирует, что интеграция текстовой информации значительно улучшает точность классификации патологий по сравнению с чисто визуальными моделями. Данная разработка имеет высокую практическую значимость для радиологии и профессиональной медицины труда, позволяя автоматизировать скрининг и снизить риск диагностических ошибок при выявлении профессиональных заболеваний легких.

диагностика радиология мультимодальные модели+3

Artificial Intelligence in Medicine Оригинал

Новость4522 мая

Материал представляет собой обзор новых инструментов и экспериментальных функций семейства моделей Gemini, разработанных специально для расширения масштабов и точности научных исследований. Основной акцент сделан на использовании мультимодальных возможностей ИИ для обработки сложных научных данных, которые ранее требовали колоссальных вычислительных ресурсов и ручного анализа. Представленные инструменты позволяют ученым автоматизировать поиск закономерностей в больших массивах данных, ускорять процесс выдвижения гипотез и моделирования сложных систем. Хотя в данном фрагменте не приводятся конкретные клинические результаты, технология позиционируется как фундаментальный фундамент для ускорения открытий в различных дисциплинах, включая биомедицину. Применение таких моделей может радикально изменить подход к анализу геномных данных, структурных белков и сложных медицинских изображений. Это важный шаг в сторону интеграции генеративного ИИ в повседневную исследовательскую практику ученых во всем мире.

генеративный ИИ научные исследования мультимодальные модели+1

DeepMind Health Оригинал

Новость9518 мая

Исследователи разработали инновационную модель глубокого обучения под названием PLASMA (Predicting Lung Adenocarcinoma recurrence via Selective Multimodal Attention), предназначенную для прогнозирования раннего рецидива аденокарциномы легкого (LUAD). Модель использует мультимодальный подход, интегрируя клинические данные, профили экспрессии мРНК и данные о мутациях пациентов с первичными стадиями I-III. Обучение проводилось на масштабном наборе данных The Cancer Genome Atlas (TCGA), что позволило достичь высокой точности. В ходе тестирования PLASMA продемонстрировала превосходство над традиционными методами машинного обучения, показав показатель AUROC 85,0% на тестовой выборке TCGA и 76,5% на внешней валидационной выборке TRACERx Lung. Данная разработка имеет высокую клиническую значимость, так как позволяет проводить эффективную стратификацию рисков и более точно прогнозировать выживаемость пациентов после резекции опухоли. Использование мультимодальных нейросетей открывает новые возможности для персонализированной онкологии в диагностике рецидивов.

онкология диагностика глубокое обучение+3

bioRxiv — Bioinformatics Оригинал

Новость8514 апр.

В представленном материале рассматривается новая итерация модели Gemini Robotics-ER 1.6, предназначенная для качественного улучшения автономных робототехнических систем. Основной фокус исследования направлен на развитие способностей к пространственному рассуждению (spatial reasoning) и многоракурсному пониманию сцены (multi-view understanding). Технология позволяет роботам более эффективно интерпретировать окружающую среду, что критически важно для выполнения сложных манипуляций и навигации в динамических условиях. В отличие от предыдущих версий, модель 1.6 демонстрирует прогресс в области 'embodied reasoning' — способности ИИ связывать визуальные данные с физическими действиями в реальном пространстве. Это открывает новые возможности для интеграции продвинутых мультимодальных моделей в медицинскую робототехнику, например, для проведения высокоточных манипуляций при хирургических вмешательствах или автоматизированной помощи пациентам. Внедрение таких моделей позволяет сократить ошибки позиционирования и повысить уровень автономности роботов в неструктурированных средах.

робототехника мультимодальные модели автономные системы+2

DeepMind Health Оригинал

Новость10013 апр.

В исследовании, опубликованном в журнале npj Digital Medicine, представлена инновационная мультимодальная модель на базе архитектуры Vision-Language для работы с диффузными глиомами у взрослых. Основная задача модели заключается в автоматизации двух критически важных процессов: прогнозировании молекулярно-генетического статуса опухоли и генерации структурированных радиологических отчетов на основе медицинских изображений. Методология объединяет визуальные признаки МРТ-снимков с текстовыми данными, что позволяет достичь высокой точности в определении биомаркеров, которые традиционно требуют дорогостоящей инвазивной биопсии. Использование ИИ позволяет сократить время постановки диагноза и минимизировать человеческий фактор при интерпретации сложных снимков. Результаты демонстрируют потенциал технологии в интеграции визуального анализа и текстовой генерации, что может значительно ускорить процесс принятия клинических решений в нейроонкологии. Данная разработка является важным шагом к созданию полностью автоматизированных систем поддержки принятия врачебных решений (СППВР) в радиологии.

диагностика нейроонкология радиология+3

npj Digital Medicine Оригинал

Новость7512 апр.

Исследователи представили HalluCodon — кастомизируемый фреймворк, использующий мультимодальные языковые модели для проектирования кодирующих последовательностей, адаптированных под конкретные виды растений. Методология основана на стратегии дизайна через «галлюцинацию», где процесс направляется двумя предиктивными модулями: CodonNAT, оценивающим естественность кодонов, и CodonEXP, прогнозирующим потенциал экспрессии. Система позволяет пользователям дообучать (fine-tune) предобученные белковые и РНК-языковые модели на собственных наборах данных. Текущая реализация включает базовые модели, обученные на кодирующих последовательностях и протеомах 15 различных видов растений. Бенчмарк-тесты подтвердили, что сгенерированные последовательности точно воспроизводят паттерны использования кодонов хозяина и обеспечивают высокие уровни экспрессии в растительных системах. Данная разработка имеет высокую значимость для синтетической биологии, молекулярного земледелия и создания трансгенных культур.

синтетическая биология языковые модели мультимодальные модели+2

bioRxiv — Bioinformatics Оригинал

Новость10012 апр.

В исследовании, опубликованном в журнале npj Digital Medicine, представлена инновационная методология использования визуально-языковых моделей (VLM) для глубокого анализа легочных узлов. Авторы предлагают подход «graphicalized vision-language modeling», который объединяет визуальные признаки КТ-снимков с текстовыми описаниями для более точной интерпретации патологий. Данная модель направлена на автоматизацию процесса обнаружения узлов и, что более важно, на эффективную стратификацию рисков злокачественности. Использование графических структур позволяет нейросети лучше понимать пространственные взаимосвязи между компонентами узла и окружающими тканями. Внедрение подобных систем в клиническую практику может значительно снизить нагрузку на радиологов и повысить точность ранней диагностики рака легких. Результаты демонстрируют потенциал интеграции мультимодальных данных для создания более надежных систем поддержки принятия врачебных решений в онкологии.

диагностика онкология радиология+3

npj Digital Medicine Оригинал

Новость8510 апр.

Meta представила Muse Spark — проприетарную мультимодальную модель, которая демонстрирует выдающиеся результаты в медицинских бенчмарках (HealthBench Hard), значительно опережая конкурентов. Несмотря на успех в области медицинских рассуждений, компания отказывается от открытого подхода, характерного для серии Llama.

мультимодальные модели медицинские бенчмарки медицинские рассуждения+2

AI News Healthcare

мультимодальные модели

Медицинский визуальный вопрос-ответ с использованием мультимодальных моделей: систематический мини-обзор (2023–2026)

TabulaTime: Новое мультимодальное глубокое обучение для прогнозирования острого коронарного синдрома путем интеграции экологических и клинических данных

SiCLIP: Объяснимая мультимодальная платформа для диагностики силикоза

Gemini для науки: ИИ-эксперименты и инструменты для новой эры открытий

Мультимодальная нейросетевая модель для прогнозирования раннего рецидива аденокарциномы легкого

Gemini Robotics-ER 1.6: Обеспечение задач робототехники в реальном мире через улучшенное воплощенное рассуждение

Надежная мультимодальная модель (Vision-Language) для прогнозирования молекулярного статуса и генерации радиологических отчетов при диффузных глиомах у взрослых

HalluCodon: оптимизация кодонов для конкретных видов с использованием мультимодальных языковых моделей

Графическое визуально-языковое моделирование для комплексного анализа легочных узлов и стратификации рисков

У Meta есть конкурентоспособная ИИ-модель, но она теряет свою open-source идентичность