В данном исследовании рассматривается применение вариационных автоэнкодеров (VAE) как мощного инструмента для обучения без учителя, в частности для обнаружения аномалий и кластеризации данных. Авторы предлагают использовать вероятностную метрику реконструкции (reconstruction likelihood) в качестве стохастической альтернативы традиционным детерминированным показателям ошибки. В ходе работы тестировались различные архитектуры VAE, сочетающие реконструкционную вероятность с обучаемым или управляемым данными априорным распределением. Методология включала использование методов снижения размерности, таких как t-SNE и UMAP, для визуализации латентного пространства, а также алгоритмов k-means и HDBSCAN для верификации кластеров. Результаты показали, что энкодер VAE эффективно отображает данные в латентное пространство с четко выраженной кластерной структурой, соответствующей истинным меткам. Исследование доказывает, что использование семантических признаков в сочетании с вероятностью реконструкции обеспечивает научно обоснованный подход к идентификации типичных образцов и аномалий, что имеет высокий потенциал для клинического применения в анализе биомедицинских данных.