SEMREP謂詞的事實檢查
該項目涉及基於變壓器的語言模型,以過濾屬於SEMMedDB的以下謂詞子集的謂詞,非正式地稱為“物質交互”組:
MD Rakibul Islam Prince研究生研究助理系電氣和計算機工程系印第安納大學普爾德大學印第安納波利斯電子郵件:[email protected]
首先,為了重現結果,所有必要包都需要安裝。 “ semrepenv.yml” yaml文件封裝了我使用的conda環境。
跑步
conda env create -f semrepenv.yml
Conda激活Semrepenv
或者,
pip install -r要求.txt
在運行任何腳本或筆記本之前安裝環境。或者,您可以手動從“ unignts.txt”文件中安裝軟件包
/semrep
├ - /數據
│││─-suctance_interactions.csv
│└│─-suptance_interactions_cleaned.csv
├ - /logs
│││─bert_logfile.log
││├─Biobert_logfile.log
││└─......................................
├ - /型號
││├─-semrep_simple_bert_model
││├─-semrep_simple_biobert_model
││└─......................................
├ - /圖
││├─-bert_cat_arg_dis_impact_all.png
││├─bert_cat_arg_dis_impact_verbal.png
││├─-bert_cum_arg_dis_impact_all.png
││├─bert_cum_arg_dis_impact_verbal.png
│││─bert_precision_recall_curve_all.png
││├─bert_precision_recall_curve_verbal.png
││├─-bert_roc_curve.png
││├─bert_sub_obj_heatmap_all.png
│├│─bert_sub_obj_heatmap_verbal.png
││└─......................................
├ - /結果
││├─bert_test_set_0_0_results.csv
│││─....val_bert_results.csv
│├│─-test_bert_results.csv
││└─......................................
├├前 /src
││├─-semrep_model.ipynb
││└前uts.py
├前readme.txt
├ - ─txt
└ - semrepenv.yml
以下是該項目中的密鑰文件和文件夾的概述:
`data/':存儲原始和處理的數據文件的目錄。
`data/enternance_interactions.csv':原始數據文件
`data/enternance_interactions_cleaned.csv':處理和清潔數據文件
logs/ :包含每個模型日誌的目錄。
logs/<model_name>_logfile.log :模型<model_name>的日誌文件
models/ :包含模型的固定檢查點的目錄。
plots/ :分析過程中包含所有生成圖的目錄。
results/ :安裝測試和驗證結果的目錄。
src/ :包含模型筆記本和腳本的目錄。
src/semrep_model.ipynb :筆記本詳細介紹了項目的全部強度
src/utils.py :用於數據分析可視化任務的腳本
`readme.txt':文件詳細說明代碼庫的描述。
`ruesignt.txt':文件詳細信息必需品軟件包。
`semrepenv.yml':用於重新創建環境的文件。