يجب أن يعرف الجميع المحتوى المكرر، كما يوحي الاسم، فهذا يعني أن محتوى موقع الويب متكرر، أو أنه متكرر بشكل كبير، ويسمى أيضًا صفحة الويب المكررة، أي صفحة الويب ذات المحتوى المكرر. نظرًا لبيئة الإنترنت في الصين، تحظى عمليات جمع الانتحال بشعبية كبيرة، خاصة بعد إطلاق العديد من أنظمة إدارة المحتوى في السنوات الأخيرة، وقام المزيد والمزيد من مشرفي المواقع بتسجيل اسم النطاق، وقاموا بتحميل برنامج نظام إدارة المحتوى، وبدأوا في جمع وبناء مواقع الويب. هذا النهج غير مستحسن في الواقع، أولاً، سيشعر المستخدمون بالاشمئزاز من الكم الكبير من المحتوى المتكرر الذي تعتمد عليه محركات البحث، لذلك لن يعجبهم ذلك أيضًا.
يمكن لبعض مواقع الويب استخدام عناوين URL مختلفة للوصول إلى نفس الصفحة بسبب مشاكل في برامجها الخاصة. لقد ذكرت ذلك في مقالتي السابقة حول توحيد عناوين URL. يعد توحيد عناوين URL أمرًا مهمًا للغاية، لذا لن أناقشه هنا مع الإشارة إلى أنه يمكن القول بأن توحيد عناوين URL أمر ضروري لجميع عمليات تحسين محركات البحث. لا تحب محركات البحث المحتوى المكرر، وسيحدد البرنامج تلقائيًا الإصدار الأصلي، ثم يتجاهل الصفحات الأخرى. لكن بالنسبة لمحركات البحث، أحدهما يستهلك موارد النطاق العريض والآخر مضيعة للوقت. بالنسبة لمسؤولي مواقع الويب، لن تؤدي عناوين URL المتعددة إلى تشتيت الوزن وتقليل التصنيف فحسب، بل ستواجه أيضًا خطر التعرض للعقاب من قبل محركات البحث. وعليك أن تعلم أن العنكبوت هو مجرد برنامج في النهاية، وأن عنوان URL الموحد الذي يختاره بنفسه قد لا يكون هو ما نريده. فيما يتعلق بمسألة عقوبة نسخ صفحات المحتوى، فقد دار جدل في صناعة SEO، وهي مسألة العقوبة وعدم العقاب. شخصيًا، أعتقد أنك ستظل معاقبًا. على الرغم من أن Google قد ذكرت بوضوح في الدليل الرسمي لمشرفي المواقع أن صفحات الويب ذات المحتوى المكرر لن تتم معاقبتها، ولكن يرجى عدم إنشاء عدد كبير من صفحات الويب ذات المحتوى المكرر، لأن هذا لا يساعد. إلى تصنيف الموقع. كما أوضحت بايدو أيضًا: إذا كان معظم المحتوى الموجود على صفحة الويب الخاصة بك مكررًا مع محتوى موجود على الإنترنت، فمن المحتمل أن تتخلى بايدو عن موقعك. وعندما يتم تضمين عناوين URL المكررة هذه، عندما يقوم محرك البحث بإرجاع صفحات ويب المحتوى المكررة هذه إلى الباحث، فسيؤثر ذلك بشكل خطير على تجربة المستخدم، لأن محرك البحث يعتمد على تجربة المستخدم باعتبارها جوهره، ولا يريد يتم إدراج نتائج البحث لتكون هي نفسها. إنه على استعداد فقط لإدراج نسخة واحدة من المحتوى المكرر، وبالنسبة لصفحات المحتوى المكررة الأخرى، ستقوم محركات البحث بخفض مستوى الصفحة أو حذفها مباشرة من الفهرس.
عندما قرأت "تسريع حركة مرور موقع الويب الإصدار الثاني" هذه الأيام، وجدت أن هناك موقفًا آخر لصفحات الويب ذات المحتوى المتكرر وهو أن بائعي المنتجات ووكلاءها ينسخون معلومات المنتج من موقع الشركة المصنعة، لذلك لا بأس بالنسبة للشركة المصنعة، لأن الشركات المصنعة أوافق بشكل عام، ولكن هذا يخلق مشكلة: يظهر الكثير من المحتوى المكرر على صفحات الويب المختلفة، وهو ما لا تحبه محركات البحث. من أجل جعل منتجاتها مألوفة أكثر للعملاء، قد توفر مواقع الويب هذه بعض الإصدارات الأكثر ملاءمة للطباعة. إذا لم تتم معالجة عناوين URL هذه، فسيتم أيضًا نسخ صفحات المحتوى.
هناك موقف آخر وهو فخ العنكبوت المذكور في مقال أول من أمس، أي أن بعض مواقع التجارة الإلكترونية ستستخدم معرفات الجلسة لمنح مستخدمين مختلفين معرفات مختلفة. في هذه الحالة، سيحدث نفس الشيء في كل مرة تتسبب فيها زيارات العنكبوت للحصول على تفاصيل، يمكنك قراءة هذا المقال حول تجنب مصائد العناكب. عندما يحدد محرك البحث ما إذا كان سيتم نسخ صفحة ويب، سيكون لديه مجموعة من آليات الخوارزمية ذات الصلة لمعالجتها، وهذا يتضمن خوارزميات آلية الكشف عن المحتوى المكرر المختلفة لمحركات البحث المختلفة. نظرًا لاختلاف أوزان مواقع الويب، قد تعتبر محركات البحث المصدر الأصلي الحقيقي نسخة، والمصدر المنسوخ هو المصدر الأصلي. وهذا ينطبق بشكل خاص على مواقع الويب ذات الوزن الكبير جدًا في Baidu، مثل مقالتي هذه تم تضمينه بواسطة Baidu بعد أن قمت بنشره، وإذا أعاد سينا طباعته، فقد يستمر بايدو في الحكم على أنني أعيد طبعه.
بالإضافة إلى جزء المحتوى من صفحة الويب، تحتوي صفحات المحتوى المكررة أيضًا على عناوين متكررة وهياكل متكررة وقوالب متكررة وما إلى ذلك. الآن يعرف كل من يقوم بتحسين محركات البحث أن عنوان صفحة الويب مهم جدًا، لذلك عندما تقوم بتسمية عنوان بالنسبة لصفحة ويب، حاول الانتقال إلى Baidu وGoogle والبحث لمعرفة ما إذا كان هناك بالفعل عنوان مثل هذا أو مشابه لهذا العنوان. حاول عدم تكرار العنوان. فيما يتعلق بالتكرار الهيكلي، تشمل الأنظمة الشائعة بعض أنظمة CMS وبرامج بناء مواقع الويب وبرامج المنتديات وما إلى ذلك. نظرًا لاستخدام هذه البرامج على نطاق واسع، غالبًا ما تحتوي هياكل عناوين URL الخاصة بها على مناطق كبيرة من التكرار، يمكنك دراسة ذلك بنفسك ومحاولة تحقيق بنية عنوان URL فريدة من نوعها قدر الإمكان. إذن ما هو تكرار القالب؟ في الوقت الحاضر، أصبحت عتبة إنشاء موقع ويب أقل فأكثر. يقوم العديد من الأشخاص بتحميل برنامج، وتطبيق قالب افتراضي ونسيانه، على الرغم من أن المحتوى هو الأكثر أهمية، إلا أنه لا يزال يوصى بتعديل القالب الافتراضي يتم استخدام القالب الافتراضي بشكل عام على نطاق واسع جدًا. غالبًا ما يؤدي هيكل تخطيطه ورمز HTML أو رمز CSS الموجود في القالب إلى حدوث ازدواجية بمعنى آخر، بالنسبة لممارسي تحسين محركات البحث، من أجل تحسين أداء تحسين محركات البحث بشكل أفضل، يوصى بتعديله.
هناك أيضًا مواقع مرآة، مذكورة في هذه المدونة، يمكنك البحث عنها، لكنني لن أصفها هنا. لن نتناول المزيد من التفاصيل حول مشكلة صفحات المحتوى المنسوخة الناتجة عن إعادة طباعة المقالات وانتحالها. شيء آخر يجب تجنبه هو أن محتوى موقع الويب قليل جدًا، على سبيل المثال، تحتوي بعض المواقع على محتوى موضوعي قليل جدًا في صفحات المحتوى الخاصة بها، بالإضافة إلى ذلك، تحتوي كل صفحة حتمًا على أجزاء مشتركة، مثل شريط التنقل، أسفل الصفحة، وما إلى ذلك. إذا كان مقدار المحتوى الموضوعي أقل من هذه المحتويات، فقد يتم الحكم عليها أيضًا على أنها صفحة محتوى مكررة بواسطة محركات البحث. هناك أيضًا تفاصيل تحتوي بعض مواقع الويب على صفحات فارغة بسبب الإهمال أو لأسباب أخرى. إذا كان هناك عدد كبير من الصفحات الفارغة، فسيتم الخلط بينها وبين المحتوى المكرر.
يوجد أيضًا موقع ويب خاص بنوع الخدمة أو المنتج. عند التشغيل حسب المنطقة، تحتوي بعض المنتجات أو أنواع الخدمات على نطاقات أصغر، أو تكون متماثلة. يقوم هذا النوع من الصفحات بتعديل المنطقة ومعلومات المعلمات الأخرى فقط، ولكنه يعدل معظم المحتوى الآخر لا يزال هو نفسه. هناك أيضًا مواقع إخبارية شائعة تستخدم خلاصات RSS لإنشاء محتوى ويب، وهذه المحتويات أيضًا عرضة للفيضان. تنشئ بعض مواقع الويب ملفات ثابتة حقيقية قبل مراجعتها، ولا يتم حذف صفحات html الحقيقية هذه بعد المراجعة. إذا تم تغيير بنية موقع الويب ولكن المحتوى لم يتغير، فلا ينبغي حذف ملفات html الموجودة في هذه الأدلة الحقيقية في بعض الأحيان سيؤدي أيضًا إلى درجة عالية من تكرار محتوى الويب. وبالمثل، قد تؤدي إعدادات الملخص غير الصحيحة أيضًا إلى تكرار صفحات المحتوى. من أجل تحسين تجربة المستخدم، تعمل الآن المزيد والمزيد من مواقع الويب، وخاصة مواقع الأخبار، على تمكين وظائف ملخص المقالات، ولا توفر للمستخدمين تصفحًا مريحًا فحسب، بل قد تتسبب أيضًا في سوء الفهم أعتقد أن المحتوى المكرر، والحالة الأخرى غير الشائعة هي http وhttps، وما إلى ذلك. من الضروري العمل على التفاصيل لتحسين موقع الويب، وسيؤثر المحتوى المكرر على موقع الويب على تصنيف موقع الويب إلى حد ما. مصدر هذا المقال: مصدر Shenzhen SEO http://www.zhsem.com/ يرجى الإشارة عند إعادة الطباعة، شكرًا لك!
المساحة الشخصية للمؤلف شياو وومينغ