Исследование ClinicRealm представляет собой сравнительный анализ эффективности больших языковых моделей (LLM) и традиционных методов машинного обучения для задач клинического прогнозирования, не требующих генерации текста. Авторы пересматривают актуальность применения LLM в клинической практике, где требуется точность предсказаний, а не креативность. Методология включает бенчмаркинг различных моделей на реальных клинических наборах данных с использованием метрик точности, чувствительности и специфичности. Ключевой вывод работы заключается в том, что для многих негенеративных задач традиционные алгоритмы (логистическая регрессия, градиентный бустинг, SVM) могут превосходить LLM по точности при меньших вычислительных затратах. Исследование подчёркивает необходимость критической оценки целесообразности использования ресурсоёмких LLM в клинических системах. Результаты имеют практическое значение для выбора архитектуры моделей в медицинских приложениях, где важны интерпретируемость и воспроизводимость. Работа публикуется в npj Digital Medicine — ведущем рецензируемом журнале в области цифрового здравоохранения.