Исследование оценивает способность пяти современных языковых моделей (включая GPT-5 и GPT-4o) решать клинические задачи, связанные с лечением болей в пояснице. Авторы выявили критические ошибки в безопасности и полноте ответов, а также доказали, что структурированный промпт-инжиниринг может значительно улучшить качество медицинских рекомендаций ИИ.
Данное исследование, опубликованное в журнале npj Digital Medicine, посвящено изучению эффективности различных методов промпт-инжиниринга при использовании больших языковых моделей (LLM) для поддержки принятия клинических решений в терапии гипертензии. Авторы анализируют, как вариации в формулировках запросов (multitype prompt engineering) влияют на точность рекомендаций по подбору антигипертензивной терапии. В работе исследуется способность моделей сопоставлять клинические данные пациента с международными протоколами лечения. Основной акцент сделан на минимизации галлюцинаций и повышении соответствия ответов ИИ доказательной медицине. Результаты демонстрируют, что структурированный подход к проектированию промптов существенно повышает клиническую релевантность ответов моделей. Исследование имеет высокую значимость для интеграции LLM в повседневную практику врачей-кардиологов и автоматизацию поддержки принятия решений.