Vérification de la factualité des prédications SEMREP
Le projet traite d'un modèle de langue basé sur un transformateur pour filtrer les prédications appartenant au sous-ensemble suivant de prédicats de SEMMEDDB, appelé de manière informelle du groupe "Interactions de substances":
MD Rakibul Islam Prince Graduate Research Assistant Department of Electrical and Computer Engineering Indiana University-Purdue University Indianapolis Courriel: [email protected]
Pour reproduir les résultats au début, tous les packages nécessitant la nécessité sont nécessaires pour être installés. Le fichier YAML "SemRepenv.yml" résume l'environnement conda que j'ai utilisé.
courir
conda envate -f semrepenv.yml
conda activer SemRepenv
ou,
pip install -r exigences.txt
Pour installer l'environnement avant d'exécuter des scripts ou un ordinateur portable. Ou, vous pouvez installer manuellement les packages à partir du fichier "exigence.txt"
/ semrep
├fiques / données
│ ├fiquesl
│ └fique
├fiques / journaux
│ ├── bert_logfile.log
│ ├fique
│ └fique
├fiques / modèles
│ ├── SEMREP_SIMPLE_BERT_MODEL
│ ├fique
│ └fique
├fiques / tracés
│ ├── bert_cat_arg_dis_impact_all.png
│ ├sé
│ ├fiques
│ ├fiques
│ ├fiques
│ ├fique
│ ├fique
│ ├fiques
│ ├fique
│ └fique
├fiques / résultats
│ ├fiques
│ ├fiques
│ ├── test_bert_results.csv
│ └fique
├── / src
│ ├fique
│ └fique
├fiques
├til les exigences.txt
└tilmet SemRepenv.yml
Vous trouverez ci-dessous un aperçu des fichiers et dossiers clés de ce projet:
`Data / ': répertoire où les fichiers de données bruts et traités sont stockés.
`data / substance_interactions.csv ': fichier de données brutes
`data / substance_interactions_cleaned.csv ': fichier de données traité et nettoyant
logs/ : répertoire contenant les journaux pour chaque modèle.
logs/<model_name>_logfile.log : logfile pour modèle <Model_name>
models/ : répertoire contenant les points de contrôle à finetumed des modèles.
plots/ : répertoire contenant toutes les parcelles générées pendant l'analyse.
results/ : Répertoire où les résultats du test et de la validation sont installés.
src/ : répertoire contenant les cahiers et scripts du modèle.
src/semrep_model.ipynb : Note à carbural détaillant l'implimentation complète du projet
src/utils.py : scripts utilisés pour les tâches de visualisation d'analyse des données
`Readme.txt ': fichier détaillant la description de la base de code.
`exigence.txt ': Détails de fichiers Packages nécessaires.
`SemRepenv.yml ': dossier pour recréer l'environnement.