TimeDiff
1.0.0
ที่เก็บนี้มีการใช้งานรหัสสำหรับ TimeDiff ซึ่งเป็นแบบจำลองการแพร่กระจายที่ออกแบบมาสำหรับการสร้างข้อมูลอนุกรมเวลาแบบผสมใน EHR งานของเราได้รับการยอมรับจาก วารสารสมาคมสารสนเทศทางการแพทย์อเมริกัน (JAMIA)
requirements.txt เพื่อติดตั้งการพึ่งพาetdiff_train.py เป็นสคริปต์ในการเริ่มต้นการฝึกอบรมแบบจำลอง หลังจากการฝึกอบรมเสร็จสมบูรณ์แล้วมันจะสร้างข้อมูลอนุกรมเวลา EHR สังเคราะห์โดยอัตโนมัติและจัดเก็บไว้ในไดเรกทอรีที่กำหนดโดยผู้ใช้ ไดเรกทอรีนี้สามารถระบุได้ด้วย --check_point_path อาร์กิวเมนต์บรรทัดคำสั่งmodels/ETDiff โปรดดูไดเรกทอรี preprocess สำหรับสมุดบันทึก Jupyter และสคริปต์ Python เกี่ยวกับวิธีการประมวลผลข้อมูล EHR ล่วงหน้าสำหรับการฝึกอบรมและการประเมินผลแบบจำลอง
หมายเหตุ: โปรดตั้งค่า PYTHONPATH อย่างถูกต้องกับรูทของที่เก็บนี้เพื่อเรียกใช้โมเดลพื้นฐาน
เราขอแนะนำให้ใช้สภาพแวดล้อมที่เป็นอิสระสำหรับแต่ละรุ่นพื้นฐานเนื่องจากบางรุ่นมีข้อกำหนดที่แตกต่างกันอย่างชัดเจน (ตัวอย่างหนึ่งคือรุ่น Python สำหรับ TensorFlow 1.x) โปรดดูที่ที่เก็บรหัสสำหรับ baselines และภาคผนวก A.4.4 ในเอกสารของเราสำหรับรายละเอียดเพิ่มเติม
baselines/ehrmgan_train.py ; การใช้งานจะถูกเก็บไว้ที่ models/ehr_m_ganbaselines/dspd_train.py ; การใช้งานจะถูกเก็บไว้ที่ models/tsdiff ; หากต้องการใช้ CSPD มากกว่า DSPD ให้ใช้การแพร่กระจายอย่างต่อเนื่องสำหรับอาร์กิวเมนต์ --diffusion กระจายbaselines/gtgan_train.py ; การใช้งานจะถูกเก็บไว้ที่ models/gt_ganbaselines/timegan_train.py ; การใช้งานจะถูกเก็บไว้ที่ models/time_ganbaselines/rcgan_train.py ; การใช้งานจะถูกเก็บไว้ที่ models/rc_ganbaselines/crnngan_train.py ; การใช้งานจะถูกเก็บไว้ที่ models/crnn_ganbaselines/pt_forcing_train.py ; การใช้งานจะถูกเก็บไว้ที่ models/p_or_t_forcing ; ผ่านอาร์กิวเมนต์บรรทัดคำสั่ง -adversarial ใช้ p -forcing มิฉะนั้นจะใช้ T-Forcingbaselines/halo_preprocess.py และคำอธิบายที่จัดทำโดยผู้เขียน Halo ในต้นฉบับของพวกเขาเพื่อประมวลผลข้อมูลอินพุตล่วงหน้า เรียกใช้ baselines/halo_train.py เพื่อฝึกอบรมโมเดลและ baselines/halo_generate.py สำหรับการสุ่มตัวอย่าง การใช้งานจะถูกเก็บไว้ที่ models/halo eval_samples.py เป็นสคริปต์ที่รับผิดชอบในการเรียกใช้ตัวชี้วัดการประเมินทั้งหมดที่กล่าวถึงในบทความ; ในการเรียกใช้รหัสให้ผ่านตัวชี้วัดที่ตั้งใจไว้เพื่อใช้อาร์กิวเมนต์บรรทัดคำสั่ง --metric รวมถึงข้อมูลการฝึกอบรม ( --train_path ), การทดสอบข้อมูล ( --test_path ) และข้อมูลสังเคราะห์ ( --sync_path )evaluate/utility.pyevaluate/privacy.py py.py @article { tian2024reliable ,
title = { Reliable generation of privacy-preserving synthetic electronic health record time series via diffusion models } ,
author = { Tian, Muhang and Chen, Bernie and Guo, Allan and Jiang, Shiyi and Zhang, Anru R } ,
journal = { Journal of the American Medical Informatics Association } ,
pages = { ocae229 } ,
year = { 2024 } ,
publisher = { Oxford University Press }
}