البحث الرئيسي في هذه المقالة هو برمجة Java من خلال مطابقة البيانات والجمع بين البيانات (المعالجة المسبقة للبيانات) ، على النحو التالي.
وصف البيانات
يجمع البرنامج التالي بين البيانات بالتنسيق التالي.
يمثل كل صف من هذا الجدول معرف المستخدم وخصائص المستخدم. من بينها ، لدى المستخدم متجه ميزة واحد فقط ، أي أن العمود الأول لن يتكرر.
يمثل العمود الأول من هذا الجدول معرف المستخدم ، ويمثل العمود الثاني الفيلم الذي يشاهده المستخدم ، ويمثل العمود الثالث درجة المستخدم للفيلم (1-13 نقطة) ، ويمثل العمود الرابع درجة المستخدم للفيلم ، لكن نطاق الدرجات هو 1-5 نقطة.
وصف المشكلة
عند المعالجة المسبقة ، كيفية إضافة خصائص المستخدم إلى الجدول الثاني؟ في الواقع ، الطريقة بسيطة للغاية. ما عليك سوى تطابق معرف المستخدم للجدول الثاني مع معرف المستخدم للجدول الأول. تظهر نتيجة الدمج في الشكل أدناه.
معالج البيانات
حزمة صفقة ؛ استيراد java.io.bufferedreader ؛ استيراد java.io.file ؛ استيراد java.io.fileinputStream ؛ استيراد java.io.ioException ؛ import java.io.inputstreamer java.util.list ؛/** المؤلف: تشيان يانغ ، كلية الإدارة ، جامعة هافي للتكنولوجيا* البريد الإلكتروني: [email protected]*/public class getPuser {public static list <string> readDocs (new docspath ، string code) rewwes ioexception {bufferedreader reader = new ملف (docspath)) ، رمز)) بينما ((s = reader.readline ())! = null) {userProductScore.add (s) ؛} reader.close () FileInputStream (FileInputStream جديد (ملف جديد (DocSpath1) ، Code1) ؛ String S1 = null ؛ hashmap <string ، string> userFeatureMap = new hashmap <string ، string> () ؛ i <arr.length ؛ Match (قائمة <Tring> userProductScore ، HashMap <string ، string> userfeaturemap) يلقي ioException {list <string> userCoreAndFeature = new ArrayList <> () ؛ user_id = userProductScore.get (i) .split ("/t") [0] ؛ // الحصول على سلسلة ميزة المستخدم userfeature = userfeaturemap.get (user_id) ؛ userCoreAndFeature.add (userProductScore.get (i)+"/t"+userfeature) ؛ system.out.println (userProductScore.get (i)/t "+userfeature) ؛ {// اقرأ قائمتين نصين <Tring> userProductScore = readDocs ("البيانات/القطار/ydata-ymovies-user-movie-ratings-train-v1_0.txt" ، "gbk") ؛ hashmap <string ، string> userfeatureMap = mapread ("data/fileofuser/yahoo.txt" ، تطابق (userproductscore ، userfeaturemap) ؛}}
لخص
ما سبق يدور حول برمجة Java من خلال مطابقة وجمع تحليل مثيل البيانات (المعالجة المسبقة للبيانات). آمل أن يكون ذلك مفيدًا للجميع. يمكن للأصدقاء المهتمين الاستمرار في الرجوع إلى الموضوعات الأخرى ذات الصلة على هذا الموقع. إذا كانت هناك أي أوجه قصور ، فيرجى ترك رسالة لإشارةها. شكرا لك يا أصدقائك لدعمكم لهذا الموقع!