Исследование посвящено решению критической проблемы машинного обучения в прецизионной онкологии: неоднородному качеству прогнозов и «скрытым ошибкам» моделей при изменении распределения данных. Авторы провели бенчмаркинг семи моделей, учитывающих неопределенность, сравнивая эпистемическую неопределенность (через ансамбли) и алеаторную неопределенность (через моделирование распределений). Результаты показали, что ансамбли гауссовских нейронных сетей эффективно выявляют данные, выходящие за рамки обучающей выборки (out-of-distribution). Применение фильтрации по 10% наиболее уверенных прогнозов позволило снизить среднюю квадратичную ошибку (MSE) на 64%. Кроме того, авторы выявили транскриптомные сигнатуры непредсказуемости, определив конкретные гены, связанные с неопределенностью прогноза. Работа также демонстрирует потенциал активного обучения (active learning) под руководством оценки неопределенности для приоритизации наиболее информативных экспериментов в разработке лекарств.