SEMREPの予定の事実チェック
このプロジェクトは、「物質相互作用」グループと非公式に呼ばれるSemmedDBの述語の次のサブセットに属する予定をフィルタリングするために、変圧器ベースの言語モデルを扱います。
MD Rakibul Islam Prince大学院研究助手電気およびコンピューター工学部インディアナ大学パルデュー大学インディアナポリスメール:[email protected]
最初に結果を再現するには、すべての必需品パッケージをインストールする必要があります。 「semrepenv.yml」yamlファイルは、私が使用したコンドラ環境をカプセル化します。
走る
conda env create -f semrepenv.yml
Condaはsemrepenvをアクティブにします
または、
PIPインストール-R要件。txt
スクリプトやノートブックを実行する前に環境をインストールします。または、「compoestion.txt」ファイルからパッケージを手動でインストールすることができます
/semrep
├├) / /データ
substance_interactions.csv
│└│。-substance_interactions_cleaned.csv
├├) /ログ
│├│。-bert_logfile.log
│├│。-biobert_logfile.log
│└│。ですか... ...
├├。。/モデル
│├│ク。Semrep_simple_bert_model
│├│。— semrep_simple_biobert_model
│└│。ですか... ...
plot
│├。。
││。。
│├│。-bert_cum_arg_dis_impact_all.png
│├│。-bert_cum_arg_dis_impact_verbal.png
│├│。-bert_precision_recall_curve_all.png
│├│。-bert_precision_recall_curve_verbal.png
││。。
│├。。vert_sub_obj_heatmap_all.png
││。。bert_sub_obj_heatmap_verbal.png
│└│。ですか... ...
├··ックス / /結果
│├│。-bert_test_set_0_results.csv
│├。。val_bert_results.csv
│├。。
│└│。ですか... ...
├)rc
│││ク
│└│。-utils.py
├)readme.txt
├├)。要件。txt
└|─●semrepenv.yml
以下は、このプロジェクトのキーファイルとフォルダーの概要です。
`data/':生のデータファイルが保存されているディレクトリ。
`data/substance_interactions.csv ':rawデータファイル
`data/substance_interactions_cleaned.csv ':データファイルを処理してクリーン化します
logs/ :各モデルのログを含むディレクトリ。
logs/<model_name>_logfile.log :logfile for model <model_name>
models/ :モデルのFinetunedチェックポイントを含むディレクトリ。
plots/ :分析中に生成されたすべてのプロットを含むディレクトリ。
results/ :テストと検証の結果がインストールされているディレクトリ。
src/ :モデルノートブックとスクリプトを含むディレクトリ。
src/semrep_model.ipynb :プロジェクトの完全なインプラメントの詳細なノートブック
src/utils.py :データ分析の視覚化タスクに使用されるスクリプト
`readme.txt ':コードベースの説明を詳述するファイル。
`requastion.txt ':必須パッケージの詳細をファイルします。
`semrepenv.yml ':環境を再現するためのファイル。