Tatsachenprüfung der SEMREP -Prädikationen
Das Projekt befasst sich mit einem transformator -basierten Sprachmodell, um Prädikten zu filtern, die zu der folgenden Teilmenge von Prädikaten aus SEMMEDDB gehören, die informell als "Substanzinteraktionen" bezeichnet wird:
MD Rakibul Islam Prince Graduate Research Assistant Department of Electrical and Computer Engineering Indiana University-Purdue University Indianapolis E-Mail: [email protected]
Um die Ergebnisse zunächst zu reproduzieren, müssen alle notwendigen Pakete installiert werden. Die YAML -Datei "semrepenv.yml" enthält die von mir verwendete Konda -Umgebung.
laufen
conda env erstellen -f semrepenv.yml
Conda aktivieren Semrepenv
oder,
PIP Installation -r Anforderungen.txt
So installieren Sie die Umgebung, bevor Sie Skripte oder Notebooks ausführen. Oder Sie können die Pakete manuell aus der Datei "Anforderungen.txt" installieren
/SEMREP
├── /Daten
│ ├── Substance_Interactions.csv
│ └── Substance_Interactions_cleaned.csv
├── /Protokolle
│ ├── bert_logfile.log
│ ├── biobert_logfile.log
│ └ └── ...
├── /Modelle
│ ├── SEMREP_SIMPLE_BERT_MODEL
│ ├── SEMREP_SIMPLE_BIOBERT_MODEL
│ └ └── ...
├── /Diagramme
│ ├── BERT_CAT_ARG_DIS_IMPACT_ALL.PNG
│ ├── BERT_CAT_ARG_DIS_IMPACT_VERBAL.PNG
│ ├── BERT_CUM_ARG_DIS_IMPACT_ALL.PNG
│ ├── BERT_CUM_ARG_DIS_IMPACT_VERBAL.PNG
│ ├── BERT_PRECISION_RECALL_CURVE_ALL.PNG
│ ├── BERT_PRECISION_RECALL_CURVE_VERBAL.PNG
│ ├── BERT_ROC_CURVE.PNG
│ ├── BERT_SUB_OBJ_HEATMAP_ALL.PNG
│ ├── BERT_SUB_OBJ_HEATMAP_VERBAL.PNG
│ └ └── ...
├── /Ergebnisse
│ ├── BERT_TEST_SET_0_RESULTS.CSV
│ ├── val_bert_results.csv
│ ├── test_bert_results.csv
│ └ └── ...
├── /src
│ ├── SEMREP_MODEL.IPYNB
│ └── util.py
├── Readme.txt
├── Anforderungen.txt
└── Semrepenv.yml
Im Folgenden finden Sie einen Überblick über die Schlüsseldateien und Ordner in diesem Projekt:
"Daten/": Verzeichnis, in dem die rohen und verarbeiteten Datendateien gespeichert werden.
`Data/subance_interactions.csv ': Rohdatendatei
"Data/Substance_Interactions_cleaned.csv": Verarbeitete und saubere Datendatei
logs/ : Verzeichnis mit den Protokollen für jedes Modell.
logs/<model_name>_logfile.log : logfile für model <model_name>
models/ : Verzeichnis, die die finetunierten Checkpoints der Modelle enthält.
plots/ : Verzeichnis, das alle erzeugten Diagramme während der Analyse enthält.
results/ : Verzeichnis, in dem die Test- und Validierungsergebnisse installiert sind.
src/ : Verzeichnis mit den Modellnotizen und Skripten.
src/semrep_model.ipynb : Notebook, in dem die vollständige Implementierung des Projekts detailliert werden
src/utils.py : Skripte, die für Datenanalyse -Visualisierungsaufgaben verwendet werden
`Readme.txt ': Datei detailliert die Beschreibung der Codebasis.
"Anforderungen.txt": Dateidetails Notwendigkeitspakete.
"semrepenv.yml": Datei zur Nachbildung der Umgebung.