Verificación de hechos de las predicaciones SEMREP
El proyecto se ocupa de un modelo de lenguaje basado en transformador para filtrar predicaciones que pertenecen al siguiente subconjunto de predicados de SEMMEDDB, llamado informalmente el grupo "Interacciones de sustancia":
MD RAKIBUL ISLAM PRINCE PRINCE DESARRITO DE INVESTIGACIÓN DE INGENIERACIÓN ELÉCTRICA E COMUTADORA UNIVERSIDAD DE LA UNIVERSIDAD DE LA UNIVERSIDAD DEL PVER INDIANAPOLIS Correo electrónico: [email protected]
Para reproducir los resultados al principio, todos los paquetes necesarios deben instalarse. El archivo "semrepenv.yml" yaml encapsula el entorno de condena que utilicé.
correr
Conda env crea -f semrepenv.yml
conda activa semrepenv
o,
PIP install -r requisitos.txt
para instalar el entorno antes de ejecutar cualquier scripts o cuaderno. O bien, puede instalar manualmente los paquetes desde el archivo "requisitos.txt"
/Semrep
├── /datos
│ ├── Sustance_interactions.csv
│ └── Sustance_interactions_Cleaned.csv
├── /registros
│ ├── bert_logfile.log
│ ├── BioBert_LogFile.log
│ └── ...
├── /modelos
│ ├── Semrep_Simple_Bert_Model
│ ├── Semrep_Simple_Biobert_Model
│ └── ...
├iqut /tramas
│ ├── bert_cat_arg_dis_impact_all.png
│ ├── bert_cat_arg_dis_impact_verbal.png
│ ├── bert_cum_arg_dis_impact_all.png
│ ├── bert_cum_arg_dis_impact_verbal.png
│ ├── bert_precision_recall_curve_all.png
│ ├── bert_precision_recall_curve_verbal.png
│ ├── bert_roc_curve.png
│ ├── bert_sub_obj_heatmap_all.png
│ ├── bert_sub_obj_heatmap_verbal.png
│ └── ...
├iqute /Resultados
│ ├── bert_test_set_0_results.csv
│ ├── val_bert_results.csv
│ ├── test_bert_results.csv
│ └── ...
├── /src
│ ├── Semrep_Model.ipynb
│ └── Utilss.py
├── Readme.txt
├── requisitos.txt
└── Semrepeenv.yml
A continuación se muestra una descripción general de los archivos y carpetas clave en este proyecto:
`Data/': Directorio donde se almacenan los archivos de datos sin procesar y procesados.
`data/sustancia_interacciones.csv ': archivo de datos sin procesar
`data/sustance_interactions_cleaned.csv ': archivo de datos procesado y limpio
logs/ : Directorio que contiene los registros para cada modelo.
logs/<model_name>_logfile.log : logFile para modelo <lodel_name>
models/ : Directorio que contiene los puntos de control Finetuned de los modelos.
plots/ : Directorio que contiene todas las gráficas generadas durante el análisis.
results/ : directorio donde se instalan los resultados de la prueba y la validación.
src/ : Directorio que contiene los cuadernos y scripts modelo.
src/semrep_model.ipynb : cuaderno que detalla la implementación completa del proyecto
src/utils.py : scripts utilizados para tareas de visualización de análisis de datos
`ReadMe.txt ': archivo que detalla la descripción de la base de código.
`requisitos.txt ': detalles de archivos para paquetes necesarios.
`semrepenv.yml ': archivo para recrear el entorno.