Pemeriksaan faktualitas predikasi SEMREP
Proyek ini berurusan dengan model bahasa berbasis transformator untuk memfilter predikasi yang termasuk dalam subset predikat berikut dari SemmedDB, secara informal disebut grup "interaksi zat":
MD Rakibul Islam Prince Graduate Research Assistant Department of Electrical and Computer Engineering University University-Purdue University Indianapolis Email: [email protected]
Untuk mereproduksi hasil pada awalnya semua paket yang diperlukan perlu dipasang. File "semrepenv.yml" "semrepenv.yml" merangkum lingkungan conda yang saya gunakan.
berlari
conda env buat -f semrepenv.yml
Conda mengaktifkan semrepenv
atau,
Pip instal -r persyaratan.txt
Untuk menginstal lingkungan sebelum menjalankan skrip atau notebook apa pun. Atau, Anda dapat secara manual menginstal paket dari file "persyaratan.txt"
/semrep
├── /data
│ ├── substance_interactions.csv
│ └── substance_interactions_cleaned.csv
├── /log
│ ├── BERT_LOGFILE.LOG
│ ├── biobert_logfile.log
│ └── ...
├── /model
│ ├── semrep_simple_bert_model
│ ├── semrep_simple_biobert_model
│ └── ...
├── /plot
│ ├── BERT_CAT_ARG_DIS_IMPACT_ALL.PNG
│ ├── BERT_CAT_ARG_DIS_IMPACT_VERBAL.PNG
│ ├── BERT_CUM_ARG_DIS_IMPACT_ALL.PNG
│ ├── BERT_CUM_ARG_DIS_IMPACT_VERBAL.PNG
│ ├── BERT_PRECISION_RECALL_CURVE_ALL.PNG
│ ├── BERT_PRECISION_RECALL_CURVE_VERBAL.PNG
│ ├── BERT_ROC_CURVE.PNG
│ ├── BERT_SUB_OBJ_HEATMAP_ALL.PNG
│ ├── BERT_SUB_OBJ_HEATMAP_VERBAL.PNG
│ └── ...
├── /hasilnya
│ ├── BERT_TEST_SET_0_RESULTS.CSV
│ ├── val_bert_results.csv
│ ├── test_bert_results.csv
│ └── ...
├── /src
│ ├── semrep_model.ipynb
│ └── UTILS.PY
├── readme.txt
├── persyaratan.txt
└── semrepenv.yml
Di bawah ini adalah ikhtisar file dan folder kunci dalam proyek ini:
`Data/': Direktori di mana file data mentah dan diproses disimpan.
`data/substance_interactions.csv ': File data mentah
`data/substance_interactions_cleaned.csv ': File data yang diproses dan bersih
logs/ : Direktori yang berisi log untuk setiap model.
logs/<model_name>_logfile.log : LogFile untuk Model <Dodel_name>
models/ : Direktori yang berisi pos pemeriksaan finetuned dari model.
plots/ : Direktori yang berisi semua plot yang dihasilkan selama analisis.
results/ : Direktori di mana hasil tes dan validasi diinstal.
src/ : Direktori yang berisi buku catatan dan skrip.
src/semrep_model.ipynb : Notebook Merinci Implimasi Lengkap dari Proyek
src/utils.py : skrip yang digunakan untuk tugas visualisasi analisis data
`Readme.txt ': File merinci deskripsi basis kode.
`persyaratan.txt ': File merinci paket kebutuhan.
`semrepenv.yml ': File untuk menciptakan kembali lingkungan.