В исследовании представлена разработка методов классификации геномных вариантов вируса SARS-CoV-2, ориентированная на решение проблемы экстремального дисбаланса классов и дефицита данных о редких мутациях. Авторы предложили гибридную архитектуру RF-SVM, объединяющую случайный лес (Random Forest) и метод опорных векторов (SVM) с полиномиальным ядром для повышения чувствительности к миноритарным классам. В ходе сравнительного анализа было установлено, что классические модели машинного обучения, использующие признаки TF-IDF на основе k-меров, превосходят методы глубокого обучения по макро-усредненным метрикам эффективности. Лучший результат показал классификатор Random Forest с использованием TF-IDF, достигнув точности (accuracy) 96,3% и макро-F1-меры 0,8894 при стабильной кросс-валидации (CV accuracy = 0,9637). Гибридная модель RF-SVM продемонстрировала улучшенную способность к обнаружению редких вариантов в условиях сильного перекоса данных. Работа подчеркивает ограничения глубокого обучения в специфических геномных задачах и доказывает эффективность интерпретируемых гибридных подходов для геномного надзора.