AmazonReview LanguageGenerationDataset
Second Release: Language Generation Dataset: 200M Samples
Обработанный набор данных обзора Amazon для генерации языка (уровень символов)
Ссылка на набор данных: https://www.kaggle.com/imdeepmind/language-generation-dataset-200m-samples/
Здесь для подготовки набора данных я использовал крошечную дробь (только файл amazon_reviews_us_Musical_Instruments_v1_00.tsv.gz ) набора данных обзора продукта Amazon.