AmazonReview LanguageGenerationDataset
Second Release: Language Generation Dataset: 200M Samples
DataSet de revisão da Amazon processada para geração de idiomas (nível de caractere)
Link para o conjunto de dados: https://www.kaggle.com/imdeepmind/language-generation-dataset-200m-samples/
Aqui para preparar o conjunto de dados, usei uma fração minúscula (apenas amazon_reviews_us_Musical_Instruments_v1_00.tsv.gz ) do conjunto de dados de revisão do produto Amazon.