TimeDiff
1.0.0
يحتوي هذا المستودع على تطبيق الكود لـ TimEdiff ، وهو نموذج نشر مصمم لتوليد بيانات السلاسل الزمنية من النوع المختلط في EHR. يتم قبول عملنا من قبل مجلة جمعية المعلوماتية الطبية الأمريكية (Jamia) .
requirements.txt لتثبيت التبعيات.etdiff_train.py هو البرنامج النصي لتهيئة تدريب النموذج. بعد اكتمال التدريب ، سيقوم تلقائيًا بإنشاء بيانات السلاسل الزمنية EHR الاصطناعية وتخزينها في الدليل المحدد الذي حدده المستخدم. يمكن تحديد هذا الدليل باستخدام وسيطة سطر أوامر --check_point_path .models/ETDiff . يرجى الاطلاع على دليل preprocess لأجهزة الكمبيوتر المحمولة Jupyter و Python النصية حول كيفية معالجة بيانات EHR قبل المعالجة للتدريب والتقييم.
ملاحظة: يرجى تعيين PYTHONPATH بشكل صحيح على جذر هذا المستودع من أجل تشغيل النماذج الأساسية.
نوصي باستخدام بيئات مستقلة لكل من نماذج خط الأساس ، لأن بعضها لديه متطلبات مختلفة بشكل مميز (أحد الأمثلة على ذلك هو إصدار Python for TensorFlow 1.x). يرجى الرجوع إلى مستودع التعليمات البرمجية لخطوط الأساس والملحق A.4.4 في ورقتنا لمزيد من التفاصيل.
baselines/ehrmgan_train.py ؛ يتم تخزين التنفيذ في models/ehr_m_gan .baselines/dspd_train.py ؛ يتم تخزين التنفيذ في models/tsdiff ؛ لاستخدام CSPD بدلاً من DSPD ، استخدم الانتشار المستمر لـ --diffusion .baselines/gtgan_train.py ؛ يتم تخزين التنفيذ في models/gt_gan .baselines/timegan_train.py ؛ يتم تخزين التنفيذ في models/time_gan .baselines/rcgan_train.py ؛ يتم تخزين التنفيذ في models/rc_gan .baselines/crnngan_train.py ؛ يتم تخزين التنفيذ في models/crnn_gan .baselines/pt_forcing_train.py ؛ يتم تخزين التنفيذ في models/p_or_t_forcing ؛ تمرير وسيطة سطر الأوامر -adversarial p -forcing. خلاف ذلك ، يتم استخدام T-Forcing.baselines/halo_preprocess.py والأوصاف التي يقدمها مؤلفو HALO في مخطوطةهم للمعالجة المسبقة لبيانات الإدخال. قم بتشغيل baselines/halo_train.py لتدريب النموذج و baselines/halo_generate.py لأخذ العينات. يتم تخزين التنفيذ في models/halo . eval_samples.py هو البرنامج النصي المسؤول عن تشغيل جميع مقاييس التقييم التي تمت مناقشتها في الورقة ؛ لتشغيل الرمز ، تمرير المقياس المقصود لاستخدامه عبر وسيطة سطر الأوامر --metric ، وكذلك بيانات التدريب ( --train_path ) ، واختبار بيانات ( --test_path ) ، والبيانات الاصطناعية ( --sync_path ).evaluate/utility.py .evaluate/privacy.py . @article { tian2024reliable ,
title = { Reliable generation of privacy-preserving synthetic electronic health record time series via diffusion models } ,
author = { Tian, Muhang and Chen, Bernie and Guo, Allan and Jiang, Shiyi and Zhang, Anru R } ,
journal = { Journal of the American Medical Informatics Association } ,
pages = { ocae229 } ,
year = { 2024 } ,
publisher = { Oxford University Press }
}