В исследовании представлен новый алгоритм LAML-Pro, предназначенный для совместного вывода генотипов клеток и реконструкции деревьев их происхождения (филогений). Традиционные методы разделяют процесс на идентификацию мутаций и построение дерева, что приводит к накоплению ошибок: например, при использовании флуоресцентной визуализации частота неверных генотипов достигает 25-50%. Авторы разработали модель Probabilistic Mixed-type Missing Observation (PMMO), которая учитывает процессы редактирования генома и ошибки наблюдения одновременно. Благодаря использованию разреженности переходов в модели PMMO, LAML-Pro способен обрабатывать данные тысяч клеток менее чем за один час. Тестирование на симулированных данных показало значительное превосходство над существующими методами в точности реконструкции. При применении к реальным данным систем отслеживания линий на основе визуализации, алгоритм позволил снизить количество ошибок генотипирования в 5 раз и обеспечил более высокую пространственную когерентность деревьев клеточных линий.