التحقق من الواقعية من تنبؤات Semrep
يتعامل المشروع مع نموذج لغة قائم على المحولات لتصفية التنبؤات التي تنتمي إلى مجموعة فرعية التالية من المتنبئين من SEMMEDDB ، والتي تسمى بشكل غير رسمي مجموعة "تفاعلات المواد":
MD Rakibul Islam الأمير مساعد أبحاث أبحاث القسم الكهربائي والهندسة الحاسوبية جامعة إنديانا-بيردو؟
لإعادة استخدام النتائج في البداية ، هناك حاجة إلى تثبيت جميع الحزم الضرورية. ملف "semrepenv.yml" يامل يلف بيئة كوندا التي استخدمتها.
يجري
Conda Env Create -F Semrepenv.yml
كوندا تنشيط Semrepenv
أو،
PIP تثبيت -r متطلبات. txt
لتثبيت البيئة قبل تشغيل أي نصوص أو دفتر ملاحظات. أو يمكنك تثبيت الحزم يدويًا من ملف "المتطلبات. txt"
/سيمريب
├ /البيانات
│ ├ STEMMER_INTERCATIONS.CSV
│ └ STEMMER_INTERCATIONS_CLEANED.CSV
├ /سجلات
│ ├ bert_logfile.log
│ ├ biobert_logfile.log
│ └ ...
├ /النماذج
│ ├ semrep_simple_bert_model
│ ├ semrep_simple_biobert_model
│ └ ...
├ /المؤامرات
│ ├ bert_cat_arg_dis_impact_all.png
│ ├ bert_cat_arg_dis_impact_verbal.png
│ ├ bert_cum_arg_dis_impact_all.png
│ ├ bert_cum_arg_dis_impact_verbal.png
│ ├ bert_precision_recall_curve_all.png
│ ├ bert_precision_recall_curve_verbal.png
│ ├ bert_roc_curve.png
│ ├ bert_sub_obj_heatmap_all.png
│ ├ bert_sub_obj_heatmap_verbal.png
│ └ ...
├ /النتائج
│ ├ bert_test_set_0_results.csv
│ ├ val_bert_results.csv
│ ├ test_bert_results.csv
│ └ ...
├ /SRC
│ ├ semrep_model.ipynb
│ └ utils.py
├ readme.txt
├ المتطلبات
└ Semrepenv.yml
فيما يلي نظرة عامة على الملفات والمجلدات الرئيسية في هذا المشروع:
"البيانات/": الدليل حيث يتم تخزين ملفات البيانات الخام والمعالجة.
`data/substance_interctions.csv ': ملف البيانات الخام
`data/substance_interctions_cleaned.csv ': ملف البيانات المصنعة ونظيفة
logs/ : دليل يحتوي على سجلات لكل نموذج.
logs/<model_name>_logfile.log : logfile for model <dorm_name>
models/ : الدليل الذي يحتوي على نقاط التفتيش المحفوظة بالحيوية للنماذج.
plots/ : دليل يحتوي على جميع المؤامرات التي تم إنشاؤها أثناء التحليل.
results/ : الدليل حيث يتم تثبيت نتائج الاختبار والتحقق.
src/ : دليل يحتوي على دفاتر النموذج والبرامج النصية.
src/semrep_model.ipynb : دفتر ملاحظات يوضح التفاصيل الكاملة للمشروع
src/utils.py : البرامج النصية المستخدمة لمهام تصور تحليل البيانات
`readme.txt ': ملف يوضح وصفًا لـ codebase.
"المتطلبات.
`semrepenv.yml ': ملف لإعادة إنشاء البيئة.