Исследование посвящено разработке модульного ETL-фреймворка на базе Python, предназначенного для автоматизации извлечения высокочастотных мультимодальных данных из систем управления данными пациентов (PDMS) в условиях реанимации и периоперационного периода. Авторы решают проблему фрагментированной и закрытой архитектуры медицинских систем, которая затрудняет вторичное использование клинических данных для исследований. Разработанная система использует модели Pydantic для обеспечения строгой типизации и автоматической проверки правдоподобности данных, а также SQLAlchemy для абстракции доступа к базам данных. Ключевым преимуществом является встроенный механизм необратимой псевдонимизации с использованием «соли», что обеспечивает полное соответствие регламенту GDPR и немецкому закону о защите данных в больницах (BayKrG). Фреймворк позволяет трансформировать гетерогенные записи PDMS в стандартизированные, готовые к анализу наборы данных с обеспечением полной прослеживаемости через интегрированный аудит-лог. Это решение значительно снижает технические и регуляторные барьеры, заменяя сложные разовые запросы на воспроизводимый и масштабируемый процесс подготовки медицинских данных.