من مبدأ التجميع الذي ذكرته سابقًا ، يمكنك أن ترى أن معظم برامج التجميع تعتمد على قواعد التحليل للجمع ، مثل تحليل قواعد اسم ملف الترحيل وتحليل قواعد رمز الصفحة.
1. الوقاية من جمع أسماء ملفات الترحيل
يعتمد معظم هواة الجمع على تحليل قواعد اسم ملف الترحيل لأداء مجموعة الدُفعات والمتعددة الصفحات. إذا لم يتمكن الآخرون من العثور على قواعد اسم الملف لملف الترحيل الخاص بك ، فلن يتمكن الآخرون من جمع صفحات متعددة من موقع الويب الخاص بك على دفعات.
طريقة التنفيذ:
أعتقد أن تشفير أسماء ملفات الترحيل مع MD5 هو وسيلة أفضل. عند الحديث عن هذا ، سيقول بعض الأشخاص أنه إذا قمت بتشفير أسماء ملفات الترحيل باستخدام MD5 ، فيمكن للبعض الآخر أيضًا محاكاة قواعد التشفير للحصول على أسماء ملفات الترحيل الخاصة بك وفقًا لهذه القاعدة.
ما أريد أن أشير إليه هو أنه عندما نتشفير اسم ملف الترحيل ، لا تشفر الجزء الذي يغير اسم الملف فقط
إذا قمت بتمثيل رقم الصفحة في الصفحة ، فعندئذ يجب ألا نشفرها مثل هذا: page_name = md5 (i ، 16) & ". htm"
من الأفضل متابعة حرف واحد أو أكثر على رقم الصفحة ليتم تشفيره ، مثل: page_name = md5 (I & "أي واحد أو عدة رسائل" ، 16) و ". HTM"
نظرًا لأنه لا يمكن فك تشفير MD5 ، فإن رسائل الصفحة التي يراها الآخرون هي نتيجة تشفير MD5 ، لذلك لا يمكن أن يعرف الأفعى ما هي الحروف التي تتبعها بعد I ، إلا إذا كان يستخدم عنيفًا **** MD5 ، لكنه ليس واقعيًا.
2. منع جمع قواعد رمز الصفحة
إذا كانت صفحة المحتوى لدينا لا تحتوي على قواعد رمز ، فلا يمكن للآخرين استخراج أجزاء من المحتوى الذي يحتاجونه من الكود الخاص بك. لذا فإن الخطوة التي نحتاجها لمنع التجميع هي جعل الكود خاليًا من القواعد.
طريقة التنفيذ:
قم بعشوائية العلامات التي يحتاجها الطرف الآخر إلى استخلاصها
1. تخصيص قوالب ويب متعددة. تختلف علامات HTML المهمة في كل قالب ويب. عند تقديم محتوى الصفحة ، حدد قوالب الويب بشكل عشوائي. بعض الصفحات تخطيط مع CSS+Div ، وبعض الصفحات تخطيط مع الجدول. هذه الطريقة مزعجة بعض الشيء. بالنسبة لصفحة المحتوى ، تحتاج إلى إنشاء العديد من صفحات القالب. ومع ذلك ، فإن مكافحة التجميع شيء مملة للغاية. يمكن أن يلعب صنع المزيد من القوالب دورًا في منع التجميع ، وهو أمر يستحق كل هذا العناء لكثير من الناس.
2. إذا كانت الطريقة أعلاه مزعجة للغاية ، فقم بعشوائية علامات HTML المهمة في صفحة الويب.
كلما زاد عدد قوالب الويب التي تصنعها ، كلما كان رمز HTML عشوائيًا. كلما زادت المشكلة عندما يحلل الطرف الآخر رمز المحتوى. عندما يكتب الطرف الآخر استراتيجية جمع لموقع الويب الخاص بك ، سيكون الأمر أكثر صعوبة. في هذا الوقت ، سوف يتراجع معظم الناس لأن هذا الشخص كسول ويجمع بيانات من مواقع الويب الخاصة بالأشخاص الآخرين ~~~ دعنا نتحدث عنها مرة أخرى. في الوقت الحاضر ، يستخدم معظم الأشخاص برامج التجميع التي طورها الآخرون لجمع البيانات. بعد كل شيء ، هناك عدد قليل من الأشخاص الذين يطورون برامج جمع لجمع البيانات بأنفسهم.
هناك بعض الأفكار البسيطة لك:
1. استخدم البرامج النصية العميل لعرض المحتوى المهم لهواة جمع البيانات ولكن ليس لمحركات البحث.
2. تقسيم صفحة واحدة من البيانات إلى صفحات n لعرضها ، والتي هي أيضًا وسيلة لزيادة صعوبة التجميع.