Новость9523 мар.
Исследование оценивает способность LLM с Chain-of-Thought reasoning интерпретировать ультразвуковые признаки узлов щитовидной железы в рамках ACR-TIRADS. Grok-3 показал наивысшую точность в качественном анализе (96%), Gemini-2.5 Pro и DeepSeek-R1 превзошли в количественных задачах. Модели продемонстрировали потенциал для клинической поддержки принятия решений.