AmazonReview LanguageGenerationDataset
Second Release: Language Generation Dataset: 200M Samples
Ensemble de données Amazon traité pour la génération de langues (niveau de caractère)
Lien vers l'ensemble de données: https://www.kaggle.com/imdeepmind/language-generation-dataset-200m-samples/
Ici pour préparer l'ensemble de données, j'ai utilisé une minuscule fraction (seul amazon_reviews_us_Musical_Instruments_v1_00.tsv.gz ) de l'ensemble de données de révision des produits Amazon.