การตรวจสอบความเป็นจริงของการทำนาย SEMREP
โครงการเกี่ยวข้องกับโมเดลภาษาที่ใช้หม้อแปลงเพื่อกรองการทำนายที่เป็นของชุดย่อยของเพรดิเคตต่อไปนี้จาก SemmedDB อย่างไม่เป็นทางการเรียกว่ากลุ่ม "การโต้ตอบกับสาร" อย่างไม่เป็นทางการ:
MD Rakibul Islam Prince ผู้ช่วยวิจัยภาควิชาวิศวกรรมไฟฟ้าและคอมพิวเตอร์มหาวิทยาลัย Indiana University-Purdue University Indianapolis อีเมล: [email protected]
ในการทำซ้ำผลลัพธ์ในตอนแรกจำเป็นต้องติดตั้งแพ็คเกจที่จำเป็นทั้งหมด ไฟล์ "semrepenv.yml" yaml ห่อหุ้มสภาพแวดล้อม conda ที่ฉันใช้
วิ่ง
conda env สร้าง -f semrepenv.yml
Conda เปิดใช้งาน semrepenv
หรือ,
PIP Install -r rechent.txt
ในการติดตั้งสภาพแวดล้อมก่อนเรียกใช้สคริปต์หรือสมุดบันทึกใด ๆ หรือคุณสามารถติดตั้งแพ็คเกจได้จากไฟล์ "required.txt" ด้วยตนเอง
/semrep
├── /ข้อมูล
substance_interactions.csv
substance_interactions_cleaned.csv
├── /บันทึก
│── bert_logfile.log
│── biobert_logfile.log
...
├── /รุ่น
│── SEMREP_SIMPLE_BERT_MODEL
│── SEMREP_SIMPLE_BIOBERT_MODEL
...
├── /พล็อต
│── bert_cat_arg_dis_impact_all.png
│── bert_cat_arg_dis_impact_verbal.png
│── bert_cum_arg_dis_impact_all.png
│── bert_cum_arg_dis_impact_verbal.png
│── bert_precision_recall_curve_all.png
│── bert_precision_recall_curve_verbal.png
│── bert_roc_curve.png
│── bert_sub_obj_heatmap_all.png
│── bert_sub_obj_heatmap_verbal.png
...
├── /ผลลัพธ์
│── bert_test_set_0_results.csv
│── val_bert_results.csv
│── test_bert_results.csv
...
├── /src
│── semrep_model.ipynb
│── utils.py
├── readme.txt
├──ข้อกำหนด. txt
semrepenv.yml
ด้านล่างนี้เป็นภาพรวมของไฟล์คีย์และโฟลเดอร์ในโครงการนี้:
`data/': ไดเรกทอรีที่เก็บไฟล์ข้อมูลดิบและประมวลผลไว้
`data/substance_interactions.csv ': ไฟล์ข้อมูลดิบ
`data/substance_interactions_cleaned.csv ': ไฟล์ข้อมูลที่ประมวลผลและทำความสะอาด
logs/ : ไดเรกทอรีที่มีบันทึกสำหรับแต่ละรุ่น
logs/<model_name>_logfile.log : logfile สำหรับ model <model_name>
models/ : ไดเรกทอรีที่มีจุดตรวจ Finetuned ของรุ่น
plots/ : ไดเรกทอรีที่มีพล็อตที่สร้างขึ้นทั้งหมดในระหว่างการวิเคราะห์
results/ : ไดเรกทอรีที่ติดตั้งการทดสอบและตรวจสอบผลลัพธ์
src/ : ไดเรกทอรีที่มีสมุดบันทึกและสคริปต์
src/semrep_model.ipynb : สมุดบันทึกรายละเอียดการพิจารณาอย่างเต็มที่ของโครงการ
src/utils.py : สคริปต์ที่ใช้สำหรับงานการสร้างภาพการวิเคราะห์ข้อมูล
`readme.txt ': ไฟล์รายละเอียดคำอธิบายของ codebase
`ข้อกำหนด. txt ': ไฟล์ที่มีรายละเอียดแพ็คเกจที่จำเป็น
`semrepenv.yml ': ไฟล์สำหรับการสร้างสภาพแวดล้อมใหม่