Descarga de deep_qa - Descargar el código fuente deep

deep_qa

Otro código fuente

1.0.0

Descargar

Desapercibido

Deepqa está construido sobre Keras. Hemos decidido que Pytorch es una mejor plataforma para la investigación de PNL. Reescribimos Deepqa en una biblioteca de Pytorch llamada Allennlp. No habrá más desarrollo de Deepqa. Pero estamos bastante entusiasmados con Allennlp: si está haciendo un aprendizaje profundo para el procesamiento del lenguaje natural, ¡debe verlo!

Profundo

Deepqa es una biblioteca para realizar tareas de PNL de alto nivel con un aprendizaje profundo, particularmente enfocado en varios tipos de respuesta de preguntas. Deepqa se basa en la parte superior de Keras y TensorFlow, y puede considerarse una interfaz para estos sistemas que facilita la PNL.

Específicamente, esta biblioteca proporciona los siguientes beneficios sobre Keras / TensorFlow liso:

Es fácil obtener NLP correctamente en Deepqa.
- En Keras, hay muchos problemas en torno a secuencias de acolchado y enmascaramiento que no se manejan bien en el código principal de Keras, y tenemos un código bien probado que hace lo correcto para, por ejemplo, calcular atenciones sobre secuencias acolchadas, acolchando todas las instancias de entrenamiento a las mismas longitudes (posiblemente dinámicamente por la lotes, para minimizar la computación que se desperdicia en las tokens), o la distribución de textos de textos o las palabras dinámicas.
- Deepqa proporciona una API agradable y consistente alrededor de la construcción de modelos PNL. Esta API tiene funcionalidad en torno a procesar instancias de datos, integrar palabras y/o caracteres, obtener fácilmente varios tipos de codificadores de oraciones, etc. Hace que la construcción de modelos para tareas de PNL de alto nivel sea fácil.
Deepqa proporciona una interfaz limpia para la capacitación, la validación y la depuración de los modelos Keras. Es fácil experimentar con variantes de una familia modelo simplemente cambiando algunos parámetros en un archivo JSON. Por ejemplo, los detalles de cómo se representan las palabras, ya sea con vectores de guante fijos, vectores de Word2Vec ajustados o una concatenación de aquellos con un CNN a nivel de carácter, todos se especifican por parámetros en un archivo JSON, no en su código real. Esto hace que sea trivial cambiar los detalles de su modelo en función de los datos con los que está trabajando.
Deepqa contiene una serie de modelos de última generación, particularmente enfocados en los sistemas de respuesta de preguntas (aunque hemos incursionado en modelos para otras tareas también). El código de modelo real para estos sistemas es típicamente 50 líneas o menos.

Corriendo Deepqa

Configurar un entorno de desarrollo

Deepqa se construye usando Python 3. La forma más fácil de configurar un entorno compatible es usar conda. Esto configurará un entorno virtual con la versión exacta de Python utilizada para el desarrollo junto con todas las dependencias necesarias para ejecutar DeepQA.

Descargue e instale conda.
Cree un entorno de condena con Python 3.
```
 conda create -n deep_qa python=3.5
```
Ahora active el entorno de conda.
```
 source activate deep_qa
```
Instale las dependencias requeridas.
```
 ./scripts/install_requirements.sh
```
Establezca el PYTHONHASHSEED para experimentos repetibles.
```
 export PYTHONHASHSEED=2157
```

Ahora debería poder probar su instalación con pytest -v . ¡Felicidades! Ahora tiene un entorno de desarrollo para Deep_QA que usa TensorFlow con soporte de CPU. (Para soporte de GPU, consulte Requisitos.txt para obtener información sobre cómo instalar tensorflow-gpu ).

Usar Deepqa como ejecutable

Para entrenar o evaluar un modelo utilizando un clon del repositorio de Deepqa, el punto de entrada recomendado es usar el script run_model.py . El primer argumento de ese script es un archivo de parámetros, descrito más a continuación. El segundo argumento determina el comportamiento, ya sea capacitar un modelo o evaluar un modelo capacitado con un conjunto de datos de prueba. Las opciones válidas actuales para el segundo argumento son train y test (omitir el argumento es lo mismo que train de pasar).

Los archivos de parámetros especifican la clase de modelo que está utilizando, hiperparámetros de modelos, detalles de capacitación, archivos de datos, detalles del generador de datos y muchas otras cosas. Puede ver archivos de parámetros de ejemplo en el directorio de ejemplos. Puede obtener alguna noción de qué parámetros están disponibles al mirar a través de la documentación.

En realidad, capacitar a un modelo requerirá archivos de entrada, que debe proporcionar. Tenemos una biblioteca complementaria, Deepqa Experiments, que fue diseñado originalmente para producir archivos de entrada y ejecutar experimentos, y puede usarse para generar archivos de datos requeridos para la mayoría de las tareas para las que tenemos modelos. Nos estamos moviendo para poner el código de procesamiento de datos directamente en DeepQA, de modo que los experimentos de Deepqa no son necesarios, pero por ahora, obtener archivos de datos de entrenamiento en el formato correcto se realiza más fácilmente con los experimentos de Deepqa.

Usar Deepqa como biblioteca

Si está utilizando Deepqa como biblioteca en su propio código, aún es sencillo ejecutar su modelo. En lugar de usar el script run_model.py para hacer el entrenamiento/evaluación, puede hacerlo usted mismo de la siguiente manera:

 from deep_qa import run_model, evaluate_model, load_model, score_dataset

# Train a model given a json specification
run_model("/path/to/json/parameter/file")


# Load a model given a json specification
loaded_model = load_model("/path/to/json/parameter/file")
# Do some more exciting things with your model here!


# Get predictions from a pre-trained model on some test data specified in the json parameters.
predictions = score_dataset("/path/to/json/parameter/file")
# Compute your own metrics, or do beam search, or whatever you want with the predictions here.


# Compute Keras' metrics on a test dataset, using a pre-trained model.
evaluate_model("/path/to/json/parameter/file", ["/path/to/data/file"])

El resto de las pautas de uso, ejemplos, etc., son los mismos que cuando se trabaja en un clon del repositorio.

Implementación de sus propios modelos

Para implementar un nuevo modelo en DeepQA, debe subclase TextTrainer . Hay documentación sobre lo que es necesario para esto; Consulte en particular la sección de métodos abstractos. Para un ejemplo simple de un modelo completamente funcional, consulte el etiquetador de secuencia simple, que tiene alrededor de 20 líneas de código de implementación real.

Para entrenar, cargar y evaluar modelos que ha escrito usted mismo, simplemente pase un argumento adicional a las funciones anteriores y elimine el parámetro model_class de su especificación JSON. Por ejemplo:

 from deep_qa import run_model
from .local_project import MyGreatModel

# Train a model given a json specification (without a "model_class" attribute).
run_model("/path/to/json/parameter/file", model_class=MyGreatModel)

Si está haciendo una nueva tarea, o una nueva variante de una tarea con una especificación de entrada/salida diferente, probablemente también necesite implementar un tipo Instance . La Instance maneja los datos de lectura de un archivo y la convierte en matrices numpy que pueden usarse para el entrenamiento y la evaluación. Esto solo debe suceder una vez para cada especificación de entrada/salida.

Modelos implementados

Deepqa tiene implementaciones de métodos de vanguardia para una variedad de tareas. Aquí hay algunos de ellos:

Comprensión de lectura

El lector atento, desde las máquinas de enseñanza para leer y comprender, por Hermann y otros
Lector de atención cerrada de lectores de atención cerrada para la comprensión del texto,
Flujo de atención bidireccional, del flujo de atención bidireccional para la comprensión de la máquina,

Vinculación

Atención descomponible, de un modelo de atención descomponible para la inferencia del lenguaje natural,

Conjuntos de datos

Este código permite una fácil experimentación con los siguientes conjuntos de datos:

Preguntas de ciencias de la escuela primaria AI2 (sin diagramas)
El conjunto de datos de la prueba de libros para niños de Facebook
El conjunto de datos de Facebook Babi
El conjunto de datos de Newsqa
El conjunto de datos de respuesta a la pregunta de Stanford (escuadrón)
El quién hizo qué conjunto de datos

Sin embargo, tenga en cuenta que el código de procesamiento de datos para la mayoría de esto actualmente vive en experimentos de Deepqa.

Que contribuye

Si usa este código y piensa que algo podría mejorarse, las solicitudes de extracción son muy bienvenidas. Abrir un problema también está bien, pero podemos responder mucho más rápidamente para extraer solicitudes.