Исследование посвящено оценке способности новейшей мультимодальной большой языковой модели ChatGPT-5 предоставлять точную и полезную информацию по чувствительной урологической теме — вазэктомии. Методология включала анализ 10 наиболее популярных запросов из Google Trends, на которые модель давала ответы, оцениваемые панелью из восьми экспертов (урологов, специалистов по общественному здравоохранению, акушера-гинеколога и медсестры по репродуктивному здоровью). Эксперты оценивали ответы по шести критериям, включая медицинскую точность, полноту и ясность, по 5-балльной шкале Лайкерта. Результаты показали средние баллы в диапазоне от 3.75 до 4.04, при этом наиболее высокие оценки получили ясность языка и уместность тона. Однако была выявлена значительная вариативность в оценках медицинской точности и полноты данных, а коэффициент внутриклассовой корреляции (ICC) составил -0.01, что указывает на крайне низкую согласованность между экспертами. Авторы делают вывод, что, несмотря на высокую доступность и понятность ответов, использование LLM в качестве образовательного ресурса требует строгого экспертного контроля и адаптации под целевую аудиторию.