Данное исследование посвящено критической проблеме вариативности человеческой разметки при создании обучающих выборок для моделей ИИ в цифровой патологии. Авторы анализируют методы семантической сегментации и предлагают использование вероятностного консенсуса для минимизации ошибок, вызванных субъективностью патологоанатомов. В работе исследуется корреляция между качеством аннотаций и точностью последующего обучения нейросетей. Методология включает оценку надежности нескольких экспертов и разработку алгоритма, позволяющего получить более точную «золотую стандартную» маску через вероятностное взвешивание мнений. Результаты подчеркивают, что учет неопределенности в данных сегментации значительно повышает устойчивость моделей к шуму в обучающих выборках. Это имеет решающее значение для внедрения ИИ в клиническую практику, где точность локализации патологических структур напрямую влияет на постановку диагноза.