Исследование применяет методы машинного обучения для классификации пациентов с боковым амиотрофическим склерозом (БАС) против контрольной группы на основе данных смешанных анкет, содержащих как структурированные переменные, так и свободный текст. Разработана утечка-свободная ML-пайплайн с LLM-экстракцией текста в таблицу и компактным лонгитюдным кодированием. Сравнены три конфигурации признаков: Pool1 (только структурированные данные), Pool2 (добавлены компактные суммарные признаки из первого временного пункта), Pool3 (дополнены описаниями изменений между T1 и T2). В итоговой конфигурации Pool3 Random Forest достиг точности 0.673, F1-взвешенного показателя 0.666 и коэффициента корреляции Мэттьюса 0.323 на holdout-тесте. Кросс-валидация показала F1-weighted 0.654 и MCC 0.312. Анализ ablation показал, что удаление компактного временного блока значительно снижает производительность, тогда как удаление текстового блока почти не влияет. Вывод: в малых клинических когортах ценность языковой обработки заключается не в статических признаках, а в компактном представлении лонгитюдных траекторий изменений.