Исследование оценивает способность ведущих LLM (включая Gemini и Grok) отвечать на вопросы пациентов о заболеваниях сердца. Результаты показали высокую точность и низкий уровень галлюцинаций, при этом Gemini была признана наиболее качественной моделью по совокупности факторов.