В исследовании представлен scTGCL — инновационный фреймворк, предназначенный для решения проблемы кластеризации данных секвенирования РНК единичных клеток (scRNA-seq), которая осложнена высокой размерностью и техническим шумом (dropout). Методология объединяет механизмы многоголового самовнимания (multi-head self-attention) из архитектуры Transformer с графовым контрастивным обучением для создания устойчивых представлений клеток. Авторы используют стратегии аугментации, такие как случайное маскирование генов и удаление ребер в матрицах внимания, чтобы имитировать биологическую неопределенность и технические пропуски. В ходе экспериментов на десяти реальных наборах данных scRNA-seq модель scTGCL превзошла девять современных методов по ключевым метрикам: точности кластеризации, нормализованной взаимной информации (NMI) и индексу Ранда (ARI). Помимо высокой точности, scTGCL демонстрирует значительное превосходство в вычислительной эффективности, обеспечивая существенно меньшее время выполнения на крупномасштабных наборах данных. Результаты подтверждают масштабируемость и стабильность метода при различных уровнях экспрессии генов, что делает его ценным инструментом для биоинформатики и прецизионной медицины.