AmazonReview LanguageGenerationDataset
Second Release: Language Generation Dataset: 200M Samples
Verarbeiteter Amazon -Datensatz für die Sprachgenerierung (Charakterebene)
Link zum Datensatz: https://www.kaggle.com/imdeepmind/glanguage-generation-dataset-200m-samples/
Hier für die Vorbereitung des Datensatzes habe ich den winzigen Bruch (nur amazon_reviews_us_Musical_Instruments_v1_00.tsv.gz ) des Datasets Amazon Product Review verwendet.