AmazonReview LanguageGenerationDataset
Second Release: Language Generation Dataset: 200M Samples
Conjunto de datos de revisión de Amazon procesado para la generación de idiomas (nivel de caracteres)
Enlace al conjunto de datos: https://www.kaggle.com/imdeepmind/language-generation-dataset-200m-samples/
Aquí para preparar el conjunto de datos, he usado Tiny Fraction (solo amazon_reviews_us_Musical_Instruments_v1_00.tsv.gz File) del conjunto de datos de revisión del producto de Amazon.