rc cnn dailymail
1.0.0
Código para el documento:
Un examen exhaustivo de la tarea de comprensión de lectura CNN/Daily Mail.

Los dos conjuntos de datos RC procesados:
Los conjuntos de datos originales se pueden descargar desde https://github.com/deepmind/rc-data o http://cs.nyu.edu/~kcho/dmqa/. Nuestros procesados son simplemente concatenación de todas las instancias de datos y mantener documentos, preguntas y respuestas solo para nuestras entradas.
Incrustaciones de palabras:
THEANO_FLAGS=mode=FAST_RUN,device=gpu,floatX=float32
python main.py --train_file /u/nlp/data/deepmind-qa/cnn/train.txt
--dev_file /u/nlp/data/deepmind-qa/cnn/dev.txt
--embedding_file /u/nlp/data/deepmind-qa/word-embeddings/glove.6B.100d.txt
relabeling : el valor predeterminado es verdadero.hidden_size : el valor predeterminado es 128.bidir : el valor predeterminado es verdadero.num_layers : el valor predeterminado es 1.rnn_type : el valor predeterminado es "Gru".att_func : el valor predeterminado es "bilineal".batch_size : el valor predeterminado es 32.num_epoches : el valor predeterminado es 100.eval_iter : el valor predeterminado es 100.dropout_rate : el valor predeterminado es 0.2.optimizer : el valor predeterminado es "SGD".learning_rate : el valor predeterminado es 0.1.grad_clipping : el valor predeterminado es 10. @inproceedings{chen2016thorough,
title={A Thorough Examination of the CNN/Daily Mail Reading Comprehension Task},
author={Chen, Danqi and Bolton, Jason and Manning, Christopher D.},
booktitle={Association for Computational Linguistics (ACL)},
year={2016}
}
MIT