Esta cosa es una tarea importante para un curso de examen de pregrado. Básicamente fue escrito de manera aleatoria. En ese momento, no sabía nada y no podía usar todo tipo de API, por lo que la implementación en muchos lugares era muy inapropiada. Además, el modelo también ha seleccionado el modelo más simple para guardar problemas, y no tiene valor de referencia tanto en el nivel de código como en el nivel académico.
Además, dado que no hay autorización para usar los datos, no puedo divulgar el conjunto de datos. Por favor comprenda
Sistema de preguntas y respuestas chinas basado en LSTM
Este proyecto se da cuenta de la función de encontrar la oración donde la respuesta a una pregunta determinada se encuentra en múltiples oraciones mediante el establecimiento de un modelo de red de memoria de dos vías a largo y corto plazo. Según la premisa de usar recursos de Internet de terceros , el desarrollo. Los datos se pueden verificar utilizando el modelo capacitado en capacitación.data. El MRR puede alcanzar 0.75 o más.
Cómo correr
Dependencia ambiental
programa Versión pitón 3.5.2 Flujo tensor 1.2.1 jié 0.38 Cuda 8.0 (8.0.61.2) cudnn 5.1 CUDA y CUDNN son dependencias de TensorFlow. Verifique la documentación oficial de TensorFlow para obtener el método de instalación. El resto se puede instalar utilizando el comando
pip installInstrucciones para el uso de recursos de terceros
- Al realizar la segmentación de palabras en el texto chino, se usa la segmentación de Jieba
- Al codificar buenas palabras, la codificación de incrustación de palabras se usa para evitar las pérdidas de rendimiento causadas por una codificación única. La palabra vector utiliza un archivo de vector de palabras 50 dimensional obtenido a través de la capacitación de datos fuera de línea en Wikipedia china
Ejecutar el programa
Después de instalar la biblioteca de dependencia, simplemente ejecute Main.py directamente. Si hay un modelo que ha sido capacitado, el programa le impulsará si cargar el modelo directamente o comenzar a capacitar nuevamente.
Main.py no recibe parámetros. Si necesita modificar la configuración, modifique el código directamente. Hay comentarios chinos detallados en el archivo, modifíquelos en consecuencia.
Taevaluation.py es un script de evaluación que puede proporcionar evaluaciones de MRR, MAP y ACC@1, escrita por el Asistente de Enseñanza Asistente. Hice algunas modificaciones en el formato de entrada y salida
Sobre el entrenamiento
Cuando elige no usar el modelo capacitado, o no hay un modelo capacitado, el programa usará los datos en entrenamiento. Data y desarrollo. Data para capacitar al modelo. Al usar parámetros predeterminados, la capacitación consumirá hasta 8G de memoria + 2G de memoria de video. Asegúrese de que la computadora tenga suficientes recursos de hardware por adelantado para evitar informes de errores. El proceso de capacitación completo tomó aproximadamente 12 horas bajo mis condiciones GTX 850M+I5 4210H.
Además, cuando ajusté los parámetros, incluso con los mismos parámetros, los resultados de cada entrenamiento aún pueden fluctuar en un máximo de 0.03 usando la métrica MRR, y la razón no está clara. Debido al hardware personal y las limitaciones de tiempo, solo se ha llevado a cabo un ajuste de parámetros muy aproximado, y la mayoría de los parámetros aún tienen espacio para una mayor optimización. Si está interesado, también podría intentar optimizarlo.