AmazonReview LanguageGenerationDataset
Second Release: Language Generation Dataset: 200M Samples
ชุดข้อมูลการตรวจสอบ Amazon ที่ประมวลผลสำหรับการสร้างภาษา (ระดับอักขระ)
ลิงก์ไปยังชุดข้อมูล: https://www.kaggle.com/imdeepmind/language-generation-dataset-200m-samples/
ที่นี่สำหรับการเตรียมชุดข้อมูลฉันใช้เศษเล็ก ๆ น้อย ๆ (เฉพาะ amazon_reviews_us_Musical_Instruments_v1_00.tsv.gz ไฟล์) ของชุดข้อมูลรีวิวผลิตภัณฑ์ Amazon