Descargar LSTM_language_model - Descargar el código fuente LSTM_language

LSTM_language_model

Código Fuente de IA

1.0.0

Descargar

Modelo de idioma basado en LSTM

Este repositorio contiene todo el código y los recursos relacionados con mi tesis maestra sobre el tema.

"Modelado recurrente de lenguaje neuronal: utilizando el aprendizaje de transferencia para realizar la finalización de las oraciones radiológicas"

Resumen: Motivado por los beneficios potenciales de un sistema que acelera el proceso de redacción de informes radiológicos, presentamos un modelo de lenguaje de red neuronal recurrente para modelar el lenguaje radiológico. Mostramos que los modelos de lenguaje neuronal recurrente pueden usarse para producir informes radiológicos convincentes e investigar cómo se puede mejorar su rendimiento mediante el uso de técnicas avanzadas de regularización e inicialización. Además, estudiamos el uso del aprendizaje de transferencia para crear modelos de lenguaje específicos del tema.

Datos

Los datos originales utilizados en la tesis son confidenciales. Por lo tanto, este repositorio presenta una versión del código que se ejecuta en el conjunto de datos Penn Treebank disponible aquí.

Para ejecutar el código, primero tendrá que preprocesar los datos. Se pueden encontrar más detalles sobre esto en la carpeta src/data/

Características comprobables

Al adaptar el archivo de configuración, se pueden probar las siguientes características:

Abandono variacional de capas ocultas
Atar peso
Desembolso
Incrustaciones previas al entrenamiento

Tesis y presentación

La tesis y las diapositivas se pueden encontrar en la carpeta de informes

Organización de proyectos

 ├── LICENSE
├── README.md          <- The top-level README 
├── data
│   ├── raw            <- Original PTB files 
│   ├── training_files <- Preprocessed PTB word ids
│   └── embeddings     <- word embeddings
│       │                 
│       ├── fasttext
│       └── word2vec
│
├── models             <- Trained and serialized models
│   ├── checkpoints    <- Model checkpoints
│   └── tensorboard    <- Tensorboard logs
│
├── reports            <- Thesis and presentation slides
│
├── requirements.txt   <- The requirements file for reproducing the analysis environment
│
├── src                <- Source code for use in this project.
│   │
│   ├── __init__.py    <- Makes src a Python module
│   │
│   ├── main.py        <- main file for training, testing, etc.
│   │
│   ├── config_ptb.yamp  <- config file, specifying model params
│   │
│   ├── data           <- scripts to preprocess data
│   │   │                 
│   │   ├── README.md
│   │   ├── preprocess_ptb.py
│   │   └── inverse_dict.py
│   │
│   ├── embeddings     <- scripts to train word embeddings
│   │   │                 
│   │   ├── README.md
│   │   ├── fasttext.py
│   │   └── word2vec.py
│   │
│   ├── models         <- Scripts to train models and then use trained models to make predictions
│   │   │                 
│   │   └── ptb_basic_model.py
│   │
│   └── visualization  <- Scripts to create exploratory and results oriented visualizations
│       │                 
│       ├── README.md
│       └── visualize_embeddings.py
│
└──

Proyecto basado en la plantilla del proyecto de ciencia de datos de CookieCutter. #CookiecutututDataScience

Expandir

Información adicional