Исследование сравнивает две современные модели (TriG-NER и DocDiscNER) для распознавания сложных, фрагментированных медицинских терминов. Результаты показывают, что генеративные модели лучше справляются с длинными документами, в то время как графовые архитектуры эффективнее на уровне предложений.
В исследовании представлена инновационная архитектура нейронной сети под названием Character-level Convolutional Recurrent Interaction Network (CCRI), предназначенная для решения сложных задач обработки естественного языка в контексте традиционной китайской медицины (ТКМ). Основная цель работы заключается в одновременном выполнении двух задач: распознавания именованных сущностей (NER) и извлечения семантических отношений между ними из клинических текстов. Авторы используют гибридный подход, сочетающий сверточные слои (CNN) для захвата локальных признаков на уровне символов и рекуррентные механизмы для моделирования долгосрочных контекстуальных зависимостей. Такой метод позволяет эффективно справляться со специфической терминологией ТКМ, где структура слов может быть неоднозначной. Методология исследования направлена на минимизацию ошибок при сопоставлении симптомов, лекарственных средств и методов лечения в едином аналитическом процессе. Результаты демонстрируют превосходство предложенной модели над существующими базовыми алгоритмами, обеспечивая более высокую точность (F1-score) при анализе сложных медицинских структур. Данная разработка имеет высокую практическую значимость для автоматизации обработки электронных медицинских карт и создания интеллектуальных систем поддержки принятия врачебных решений в области восточной медицины.
Исследование описывает разработку и внедрение гибридной системы, использующей ИИ для автоматического извлечения данных из бумажных медицинских форм в условиях ограниченного использования электронных карт. Результаты показали высокую точность распознавания (AUCROC > 99%) и сокращение времени на ручной ввод данных на 50%.