SEMREP谓词的事实检查
该项目涉及基于变压器的语言模型,以过滤属于SEMMedDB的以下谓词子集的谓词,非正式地称为“物质交互”组:
MD Rakibul Islam Prince研究生研究助理系电气和计算机工程系印第安纳大学普尔德大学印第安纳波利斯电子邮件:[email protected]
首先,为了重现结果,所有必要包都需要安装。 “ semrepenv.yml” yaml文件封装了我使用的conda环境。
跑步
conda env create -f semrepenv.yml
Conda激活Semrepenv
或者,
pip install -r要求.txt
在运行任何脚本或笔记本之前安装环境。或者,您可以手动从“ unignts.txt”文件中安装软件包
/semrep
├ - /数据
│││─-suctance_interactions.csv
│└│─-suptance_interactions_cleaned.csv
├ - /logs
│││─bert_logfile.log
││├─Biobert_logfile.log
││└─......................................
├ - /型号
││├─-semrep_simple_bert_model
││├─-semrep_simple_biobert_model
││└─......................................
├ - /图
││├─-bert_cat_arg_dis_impact_all.png
││├─bert_cat_arg_dis_impact_verbal.png
││├─-bert_cum_arg_dis_impact_all.png
││├─bert_cum_arg_dis_impact_verbal.png
│││─bert_precision_recall_curve_all.png
││├─bert_precision_recall_curve_verbal.png
││├─-bert_roc_curve.png
││├─bert_sub_obj_heatmap_all.png
│├│─bert_sub_obj_heatmap_verbal.png
││└─......................................
├ - /结果
││├─bert_test_set_0_0_results.csv
│││─....val_bert_results.csv
│├│─-test_bert_results.csv
││└─......................................
├├前 /src
││├─-semrep_model.ipynb
││└前uts.py
├前readme.txt
├ - ─txt
└ - semrepenv.yml
以下是该项目中的密钥文件和文件夹的概述:
`data/':存储原始和处理的数据文件的目录。
`data/enternance_interactions.csv':原始数据文件
`data/enternance_interactions_cleaned.csv':处理和清洁数据文件
logs/ :包含每个模型日志的目录。
logs/<model_name>_logfile.log :模型<model_name>的日志文件
models/ :包含模型的固定检查点的目录。
plots/ :分析过程中包含所有生成图的目录。
results/ :安装测试和验证结果的目录。
src/ :包含模型笔记本和脚本的目录。
src/semrep_model.ipynb :笔记本详细介绍了项目的全部强度
src/utils.py :用于数据分析可视化任务的脚本
`readme.txt':文件详细说明代码库的描述。
`ruesignt.txt':文件详细信息必需品软件包。
`semrepenv.yml':用于重新创建环境的文件。