В данном исследовании, опубликованном в журнале npj Digital Medicine, проводится сравнительный анализ использования анонимизированных реальных данных страховых выплат и синтетически сгенерированных данных для оценки безопасности лекарственных препаратов. Основная методология заключается в проверке того, насколько синтетические наборы данных способны воспроизвести статистические закономерности оригинальных медицинских записей без риска раскрытия персональной информации пациентов. Исследование фокусируется на способности ИИ-моделей генерировать данные, которые сохраняют клиническую значимость для выявления побочных эффектов и рисков при приеме медикаментов. Ключевым результатом является оценка точности статистических выводов, сделанных на основе синтетических данных по сравнению с контрольной группой реальных записей. Работа подчеркивает значимость синтетических данных как безопасного и масштабируемого инструмента для фармаконадзора и разработки алгоритмов машинного обучения в медицине, позволяя обходить строгие ограничения конфиденциальности. Это имеет критическое значение для ускорения исследований безопасности лекарств и обучения нейросетей в условиях жесткого регулирования защиты данных.