выживаемость

Новость9517 маяОбзор

В исследовании представлен масштабный сравнительный анализ методов отбора признаков и построения прогностических моделей на основе геномных данных, характеризующихся высокой размерностью и разреженностью. Авторы протестировали широкий спектр алгоритмов, включая классические статистические методы и современные подходы машинного обучения, на синтетических наборах данных с варьирующейся корреляцией и силой сигнала. Для практической верификации результаты были проверены на реальном когортном исследовании рака из базы данных The Cancer Genome Atlas (TCGA). Оценка проводилась по комплексному набору метрик: индексу конкордантности (C-index), F1-score, ошибке Brier score, RMSE и скорости вычислений. Исследование показало, что методы CoxBoost и Adaptive LASSO демонстрируют наиболее стабильные результаты по всем показателям, в то время как LASSO и Elastic Net наиболее эффективны при оценке конкордантности и F1-score. Результаты работы предоставляют онкологам и биоинформатикам четкие рекомендации по выбору оптимального математического аппарата в зависимости от специфических характеристик геномных данных.

биомаркеры машинное обучение онкология геномика прогностическое моделирование выживаемость

bioRxiv — Bioinformatics Оригинал

выживаемость

Бенчмарк методов идентификации биомаркеров и прогностического моделирования на разнообразных цензурированных данных