Исследование посвящено применению дискретных диффузионных моделей для генерации реалистичных филогенетических деревьев опухолей, которые кодируют клональную родословную и приобретение мутаций при эволюции рака. Авторы обучают графовые трансформеры на наборе из примерно 12 500 синтетических филогенезов, охватывающих двенадцать различных эволюционных режимов, используя процесс обратного диффузионного шумоподавления на типизированных графах. Эксперименты по масштабированию выявили немонотонную зависимость между ёмкостью модели и её производительностью: модель среднего масштаба достигла высокой структурной валидности и близкого соответствия распределения тестовым данным, тогда как более глубокая модель провалилась при фиксированных гиперпараметрах оптимизации. Эксперименты с недостатком данных показали, что разнообразное обучение приводит к более переносимым представлениям по сравнению со специализацией на одном режиме. Результаты демонстрируют, что структурные ограничения филогенеза могут быть выучены неявно через безусловную дискретную диффузию. Это открывает перспективный путь к созданию генеративных моделей эволюции опухолей, что имеет прямое значение для персонализированной онкологии и понимания механизмов развития рака. Исследование вносит вклад в развитие методов машинного обучения для анализа онкологических данных.