الحالة: أرشفة. يتم توفير الرمز كما هو مع عدم وجود تحديثات متوقعة. لسوء الحظ ، لم يعد لدي الوقت الشخصي للتكريس للحفاظ على هذا الريبو/الاستجابة للمشكلات ، أو الوصول إلى مجموعة البيانات المحاكاة بعد الآن ، على الرغم من أنني آمل أن يكون رمز النموذج وانقسامات البيانات لا يزال مفيدًا للمجتمع.
رمز للتنبؤ بالورقة القابلة للتفسير للرموز الطبية من النص السريري.
قد تعمل الإصدارات الأخرى أيضًا ، ولكن الإصدارات المدرجة هي تلك التي استخدمتها
للبدء ، قم بتحرير constants.py أولاً للإشارة إلى الدلائل التي تحمل نسخك من مجموعات بيانات Mimic-II و Mimic-III. ثم ، قم بتنظيم بياناتك بالهيكل التالي:
mimicdata
| D_ICD_DIAGNOSES.csv
| D_ICD_PROCEDURES.csv
| ICD9_descriptions (already in repo)
└───mimic2/
| | MIMIC_RAW_DSUMS
| | MIMIC_ICD9_mapping
| | training_indices.data
| | testing_indices.data
└───mimic3/
| | NOTEEVENTS.csv
| | DIAGNOSES_ICD.csv
| | PROCEDURES_ICD.csv
| | *_hadm_ids.csv (already in repo)
يمكن الحصول على ملفات Mimic-II من هذا المستودع.
الآن ، تأكد من أن مسار Python الخاص بك يتضمن الدليل الأساسي لهذا المستودع. بعد ذلك ، في دفتر Jupyter ، قم بتشغيل جميع الخلايا (في القائمة ، انقر فوق خلية -> قم بتشغيل الكل) في notebooks/dataproc_mimic_II.ipynb و notebooks/dataproc_mimic_III.ipynb . ستستغرق هذه بعض الوقت ، لذا اذهب في نزهة على الأقدام أو خبز بعض ملفات تعريف الارتباط أثناء الانتظار. يمكنك تسريعه عن طريق تخطي أقسام "تضمينات كلمة ما قبل التدريب".
لإعادة إنتاج نتائج الورقة مباشرة ، قم أولاً بتشغيل خطوات معالجة البيانات أعلاه. نحن نقدم نماذجنا التي تم تدريبنا مسبقًا لـ CAML و DR-CAML لمجموعة بيانات MIMIC-III الكاملة. يتم حفظها model.pth في الدلائل الخاصة بهم. نحن نقدم أيضًا نصًا evaluate_model.sh لإعادة إنتاج نتائجنا من النماذج.
لتدريب نموذج جديد من نقطة الصفر ، يرجى استخدام البرنامج النصي learn/training.py . تنفيذ python training.py -h للحصول على قائمة كاملة من وسيطات الإدخال والأعلام. يمكن أن تعمل train_new_model.sh في predictions/ الدلالات الفرعية كأمثلة (أو يمكنك تشغيل تلك مباشرة لاستخدام نفس المقاييس).
يتم توفير التنبؤات التي توفر النتائج في الورقة في predictions/ . يحتوي كل دليل على:
preds_test.psv ، ملف قيمة مفصل للأنابيب يحتوي على تنبؤات HADM_ID ونموذجها لجميع أمثلة الاختبارtrain_new_model.sh ، الذي يدرب نموذجًا جديدًا مع المقاييس المفرطة المقدمة في الورقة. لإعادة إنتاج نتائج F-Measure الخاصة بنا من التنبؤات ، على سبيل المثال نتائج CNN على التقليد ، قم بتشغيل python get_metrics_for_saved_predictions.py predictions/CNN_mimic2_full .