ทุกคนต้องรู้เกี่ยวกับเนื้อหาที่ซ้ำกันตามชื่อหมายความว่าเนื้อหาของเว็บไซต์ถูกทำซ้ำหรือถูกเรียกว่าหน้าเว็บที่ซ้ำกันนั่นคือหน้าเว็บเนื้อหาที่ซ้ำกัน เนื่องจากสภาพแวดล้อมทางอินเทอร์เน็ตในประเทศจีน คอลเลกชันการลอกเลียนแบบจึงค่อนข้างได้รับความนิยม โดยเฉพาะอย่างยิ่งหลังจากเปิดตัว CMS จำนวนมากในช่วงไม่กี่ปีที่ผ่านมา มีผู้ดูแลเว็บจำนวนมากขึ้นเรื่อยๆ ได้จดทะเบียนชื่อโดเมน อัปโหลดโปรแกรม CMS และเริ่มรวบรวมและสร้างเว็บไซต์ จริงๆ แล้วไม่แนะนำให้ใช้วิธีนี้ ประการแรก ผู้ใช้จะรู้สึกเบื่อหน่ายกับเนื้อหาซ้ำๆ จำนวนมากซึ่งขึ้นอยู่กับประสบการณ์ของผู้ใช้ ดังนั้น พวกเขาก็จะไม่ชอบมันเช่นกัน
เว็บไซต์บางแห่งสามารถใช้ URL ที่แตกต่างกันเพื่อเข้าถึงหน้าเดียวกันได้เนื่องจากปัญหากับโปรแกรมของตัวเอง ฉันได้กล่าวถึงสิ่งนี้ในบทความก่อนหน้าของฉันเกี่ยวกับมาตรฐานของ URL เป็นสิ่งสำคัญมาก ดังนั้นฉันจะไม่พูดถึงมันที่นี่ โดยกล่าวว่ามาตรฐานของ URL อาจกล่าวได้ว่าเป็นสิ่งจำเป็นสำหรับการเพิ่มประสิทธิภาพ SEO ทั้งหมด โปรแกรมค้นหาไม่ชอบเนื้อหาที่ซ้ำกัน โปรแกรมจะกำหนดเวอร์ชันดั้งเดิมโดยอัตโนมัติ จากนั้นจะไม่สนใจหน้าอื่นๆ แต่สำหรับเครื่องมือค้นหา หนึ่งรายการใช้ทรัพยากรบรอดแบนด์ และอีกรายการหนึ่งเป็นการเสียเวลา สำหรับผู้ดูแลเว็บไซต์ URL หลายรายการจะไม่เพียงแต่กระจายน้ำหนักและลดอันดับ แต่ยังเผชิญกับความเสี่ยงที่จะถูกลงโทษโดยเครื่องมือค้นหาอีกด้วย และคุณต้องรู้ว่าสไปเดอร์เป็นเพียงโปรแกรม และ URL มาตรฐานที่มันเลือกมาเองอาจไม่ใช่สิ่งที่เราต้องการ ส่วนประเด็นการลงโทษการคัดลอกหน้าเนื้อหานั้น ได้มีการถกเถียงกันในวงการ SEO ซึ่งเป็นประเด็นเรื่องการลงโทษและการไม่ลงโทษ โดยส่วนตัวแล้ว ฉันคิดว่าคุณจะยังคงถูกลงโทษ แม้ว่า Google จะระบุไว้อย่างชัดเจนในคู่มืออย่างเป็นทางการสำหรับผู้ดูแลเว็บว่าหน้าเว็บที่มีเนื้อหาซ้ำกันจะไม่ถูกลงโทษ แต่โปรดอย่าสร้างหน้าเว็บที่มีเนื้อหาซ้ำกันจำนวนมาก เนื่องจากสิ่งนี้ไม่เอื้ออำนวย สู่การจัดอันดับเว็บไซต์ Baidu ยังได้ชี้แจงอย่างชัดเจนว่า หากเนื้อหาส่วนใหญ่บนหน้าเว็บของคุณซ้ำกับเนื้อหาที่มีอยู่ในอินเทอร์เน็ต Baidu เว็บไซต์ของคุณก็มีแนวโน้มที่จะถูกละทิ้งโดย Baidu และเมื่อมีการรวม URL ที่ซ้ำกันเหล่านี้ไว้ เมื่อเครื่องมือค้นหาส่งคืนหน้าเว็บเนื้อหาที่ซ้ำกันเหล่านี้แก่ผู้ค้นหา มันจะส่งผลกระทบต่อประสบการณ์ผู้ใช้อย่างจริงจัง เนื่องจากเครื่องมือค้นหายึดประสบการณ์ผู้ใช้เป็นหลัก และไม่ต้องการ ผลการค้นหาที่ระบุว่าเหมือนกัน เขายินดีที่จะแสดงรายการเนื้อหาที่ซ้ำกันเพียงชุดเดียว และสำหรับหน้าเนื้อหาที่ซ้ำกันอื่นๆ เครื่องมือค้นหาจะดาวน์เกรดหน้าหรือลบออกจากดัชนีโดยตรง
เมื่อผมได้อ่าน “ความเร็วเว็บไซต์เพิ่มความเร็วรุ่นที่สอง” ทุกวันนี้ ผมพบว่าอีกสถานการณ์หนึ่งสำหรับหน้าเว็บที่มีเนื้อหาซ้ำกันคือผู้ขายและตัวแทนคัดลอกข้อมูลผลิตภัณฑ์จากเว็บไซต์ของผู้ผลิต ดังนั้นสำหรับผู้ผลิต ก็โอเค เพราะผู้ผลิต โดยทั่วไปเห็นด้วย แต่สิ่งนี้สร้างปัญหา: มีเนื้อหาที่ซ้ำกันจำนวนมากปรากฏบนหน้าเว็บต่างๆ ซึ่งเครื่องมือค้นหาไม่ชอบ เพื่อให้ผลิตภัณฑ์ของตนคุ้นเคยกับลูกค้ามากขึ้น เว็บไซต์เหล่านี้อาจมีเวอร์ชันที่เหมาะสมกว่าสำหรับการพิมพ์ หาก URL เหล่านี้ไม่ได้รับการประมวลผล หน้าเนื้อหาก็จะถูกคัดลอกด้วย
อีกสถานการณ์หนึ่งคือกับดักแมงมุมที่กล่าวถึงในบทความเมื่อวันก่อน นั่นคือเว็บไซต์อีคอมเมิร์ซบางแห่งจะใช้รหัสเซสชันเพื่อระบุรหัสที่แตกต่างกันให้กับผู้ใช้ ในกรณีนี้ สิ่งเดียวกันนี้จะเกิดขึ้นทุกครั้งที่มีการเยี่ยมชมสไปเดอร์ สำหรับรายละเอียด คุณสามารถอ่านบทความเกี่ยวกับการหลีกเลี่ยงกับดักแมงมุมได้ เมื่อเครื่องมือค้นหาพิจารณาว่าจะคัดลอกหน้าเว็บหรือไม่ ระบบจะมีชุดกลไกอัลกอริทึมที่เกี่ยวข้องในการประมวลผล ซึ่งเกี่ยวข้องกับอัลกอริธึมกลไกการตรวจจับเนื้อหาที่ซ้ำกันที่แตกต่างกันของเครื่องมือค้นหาต่างๆ เนื่องจากน้ำหนักของเว็บไซต์ที่แตกต่างกัน เสิร์ชเอ็นจิ้นอาจถือว่าแหล่งที่มาดั้งเดิมที่แท้จริงเป็นเพียงการคัดลอก และแหล่งที่มาที่คัดลอกมานั้นเป็นแหล่งที่มาดั้งเดิม โดยเฉพาะอย่างยิ่งสำหรับเว็บไซต์ที่มีน้ำหนักมากเกินไปใน Baidu เหมือนกับบทความนี้ของฉัน แม้ว่าจะเป็นเช่นนั้นก็ตาม ถูกรวมโดย Baidu หลังจากที่ฉันเผยแพร่ หาก Sina พิมพ์ซ้ำ Baidu อาจยังคงตัดสินว่าฉันพิมพ์ซ้ำ
นอกจากส่วนเนื้อหาของหน้าเว็บแล้ว หน้าเนื้อหาที่ซ้ำกันยังมีชื่อซ้ำ โครงสร้างซ้ำ เทมเพลตซ้ำ ฯลฯ ตอนนี้ใครก็ตามที่ทำ SEO รู้ดีว่าชื่อของหน้าเว็บมีความสำคัญมาก ดังนั้นเมื่อคุณตั้งชื่อชื่อเรื่อง สำหรับหน้าเว็บ ให้ลองไปที่ Baidu และ Google แล้วค้นหาว่ามีชื่อแบบนี้อยู่แล้วหรือคล้ายกับชื่อนี้ เกี่ยวกับการทำซ้ำเชิงโครงสร้าง สิ่งที่พบบ่อย ได้แก่ ระบบ CMS โปรแกรมสร้างเว็บไซต์ โปรแกรมฟอรัม ฯลฯ เนื่องจากโปรแกรมเหล่านี้มีการใช้กันอย่างแพร่หลาย โครงสร้าง URL จึงมีขอบเขตการทำซ้ำจำนวนมาก คุณสามารถศึกษาสิ่งนี้ได้ด้วยตัวเองและพยายามทำให้ได้โครงสร้าง URL มีเอกลักษณ์เฉพาะตัวให้มากที่สุด การทำสำเนาเทมเพลตคืออะไร ในปัจจุบัน เกณฑ์สำหรับการสร้างเว็บไซต์เริ่มลดลงเรื่อยๆ หลายๆ คนอัปโหลดโปรแกรม ใช้เทมเพลตเริ่มต้น และลืมไป แม้ว่าเนื้อหาจะมีความสำคัญที่สุด เทมเพลต ดาวน์โหลด โดยทั่วไปเทมเพลตเริ่มต้นจะใช้กันอย่างแพร่หลายมาก โครงสร้างเค้าโครงและโค้ด HTML หรือโค้ด CSS ในเทมเพลตมักจะทำให้เกิดความซ้ำซ้อน แม้ว่าเครื่องมือค้นหาจะตัดสินว่าเพจจะลบโค้ด HTML ทั้งหมดสำหรับพวกเราที่ชอบทำ SEO กล่าวอีกนัยหนึ่งสำหรับผู้ปฏิบัติงาน SEO เพื่อปรับปรุงประสิทธิภาพ SEO ให้ดียิ่งขึ้น ขอแนะนำให้แก้ไข
นอกจากนี้ยังมีเว็บไซต์มิเรอร์ที่มีการกล่าวถึงในบล็อกนี้ คุณสามารถค้นหาได้ แต่ฉันจะไม่อธิบายพวกเขาที่นี่ เราจะไม่อธิบายรายละเอียดเพิ่มเติมเกี่ยวกับปัญหาหน้าเนื้อหาที่ถูกคัดลอกซึ่งเกิดจากการพิมพ์ซ้ำและการลอกเลียนแบบบทความ อีกสิ่งหนึ่งที่ควรหลีกเลี่ยงคือเนื้อหาเว็บไซต์มีน้อยเกินไป เช่น บางเว็บไซต์มีเนื้อหาสำคัญในหน้าเนื้อหาน้อยเกินไป นอกจากนี้ แต่ละหน้าก็มีส่วนที่เหมือนกันอย่างหลีกเลี่ยงไม่ได้ เช่น แถบนำทางที่ด้านล่างของหน้า เป็นต้น หากปริมาณเนื้อหาสำคัญน้อยกว่าเนื้อหาเหล่านี้ เครื่องมือค้นหาอาจตัดสินว่าเป็นหน้าเนื้อหาที่ซ้ำกัน นอกจากนี้ยังมีรายละเอียดบางเว็บไซต์มีหน้าว่างเนื่องจากความประมาทเลินเล่อหรือเหตุผลอื่น ๆ หากมีหน้าว่างจำนวนมากพวกเขาจะเข้าใจผิดว่าเป็นเนื้อหาที่ซ้ำกัน
นอกจากนี้ยังมีเว็บไซต์ประเภทบริการหรือผลิตภัณฑ์ เมื่อดำเนินการตามภูมิภาค ผลิตภัณฑ์หรือบริการบางประเภทจะมีช่วงที่เล็กกว่าหรือเหมือนกัน ยังคงเหมือนเดิม นอกจากนี้ยังมีเว็บไซต์ข่าวทั่วไปที่ใช้ฟีด RSS เพื่อสร้างเนื้อหาเว็บ และเนื้อหาเหล่านี้ก็มีแนวโน้มที่จะถูกน้ำท่วมเช่นกัน เว็บไซต์บางแห่งสร้างไฟล์คงที่จริงก่อนที่จะมีการแก้ไข และหน้า html จริงเหล่านี้จะไม่ถูกลบหลังจากการแก้ไข หากโครงสร้างเว็บไซต์มีการเปลี่ยนแปลง แต่เนื้อหายังคงไม่เปลี่ยนแปลง ไฟล์ html ในไดเร็กทอรีจริงเหล่านี้ไม่ควรถูกลบออกในบางครั้ง ยังจะทำให้เกิดความซ้ำซ้อนของเนื้อหาเว็บในระดับสูงอีกด้วย ในทำนองเดียวกัน การตั้งค่าสรุปที่ไม่เหมาะสมอาจทำให้หน้าเนื้อหาซ้ำกัน เพื่อปรับปรุงประสบการณ์ผู้ใช้ ปัจจุบันเว็บไซต์จำนวนมากขึ้นเรื่อยๆ โดยเฉพาะเว็บไซต์ข่าวสาร ได้เปิดใช้งานฟังก์ชันสรุปบทความเหล่านี้ไม่เพียงแต่ให้ความสะดวกแก่ผู้ใช้ในการเรียกดูเท่านั้น แต่ยังอาจทำให้เกิดความเข้าใจผิดอีกด้วย ผมคิดว่าเนื้อหาที่ซ้ำกันและสถานการณ์ที่ไม่ปกติอีกประการหนึ่งคือ http และ https เป็นต้น จำเป็นต้องปรับปรุงรายละเอียดเพื่อเพิ่มประสิทธิภาพเว็บไซต์และเนื้อหาที่ซ้ำกันบนเว็บไซต์จะส่งผลต่อการจัดอันดับเว็บไซต์ในระดับหนึ่ง แหล่งที่มาของบทความนี้: ที่มา SEO ของเซินเจิ้น http://www.zhsem.com/ โปรดระบุเมื่อพิมพ์ซ้ำ ขอบคุณ!
พื้นที่ส่วนตัวของผู้เขียน เสี่ยว หวู่หมิง