ไม่มีโฆษณาไม่มีการติดตามไม่มีกำไร
MWMBL เป็นเครื่องมือค้นหาที่ไม่แสวงหาผลกำไรและโอเพ่นซอร์สที่ชุมชนกำหนดการจัดอันดับ เรามุ่งมั่นที่จะทดแทนเครื่องมือค้นหาเชิงพาณิชย์เช่น Google และ Bing

เรามีดัชนีของเราเองขับเคลื่อนโดยชุมชนของเรา ขณะนี้ดัชนีของเรามีขนาดเล็กกว่าเครื่องมือค้นหาเชิงพาณิชย์มากโดยมี URL ที่ไม่ซ้ำกันประมาณ 500 ล้าน URL (สถิติเพิ่มเติม) คุณภาพเป็นไปไม่ไกลจากการจับคู่เครื่องยนต์เชิงพาณิชย์ในขณะนี้ แต่คุณสามารถช่วยเปลี่ยนแปลงได้โดยการเข้าร่วมกับเรา! เราตั้งเป้าหมายที่จะมี URL ที่ไม่ซ้ำกัน 1 พันล้าน URL ที่จัดทำดัชนีภายในสิ้นปี 2567, 10 พันล้านในตอนท้ายของปี 2025 และ 100 พันล้านภายในสิ้นปี 2569 โดยที่จุดที่เราควรเทียบกับเครื่องมือค้นหาเชิงพาณิชย์
ชุมชนหลักของเราอยู่ในเมทริกซ์ แต่เรายังมีเซิร์ฟเวอร์ Discord สำหรับการอภิปรายที่ไม่เกี่ยวข้องกับการพัฒนา
ชุมชนมีหน้าที่คลานเว็บ (ดูด้านล่าง) และการดูแลผลการค้นหา เราเป็นมิตรและเป็นมิตร เข้าร่วมกับเรา!
เอกสารทั้งหมดอยู่ที่ https://book.mwmbl.org
การรวบรวมข้อมูลมีการแจกจ่ายทั่วทั้งชุมชนในขณะที่การจัดทำดัชนีจะถูกรวมเข้ากับเซิร์ฟเวอร์หลัก
หากคุณมีพลังคอมพิวเตอร์สำรองและแบนด์วิดท์วิธีที่ดีที่สุดที่คุณสามารถช่วยได้คือการเรียกใช้ชุดคำสั่งของเราด้วยเธรดให้มากที่สุดเท่าที่จะทำได้
หากคุณมี Firefox คุณสามารถช่วยได้โดยการติดตั้งส่วนขยายของเรา สิ่งนี้จะรวบรวมข้อมูลเว็บในพื้นหลัง ไม่ได้ใช้หรือเข้าถึงข้อมูลส่วนบุคคลใด ๆ ของคุณ แทนที่จะรวบรวมชุด URL ที่ส่งมาจากเซิร์ฟเวอร์กลางของเรา หลังจากแยกบทสรุปของแต่ละหน้าแล้วจะแบทช์เหล่านี้ขึ้นและส่งข้อมูลไปยังเซิร์ฟเวอร์กลางที่จะจัดเก็บและจัดทำดัชนี
แรงจูงใจของเครื่องมือค้นหาที่ได้รับการสนับสนุนจากโฆษณานั้นขัดแย้งกับการมอบประสบการณ์การใช้งานที่ดีที่สุด ไซต์เหล่านี้ได้รับการปรับให้เหมาะสมสำหรับรายได้โฆษณาโดยมีประสบการณ์ผู้ใช้เป็นอันดับสอง ซึ่งหมายความว่าหน้าเว็บจะเต็มไปด้วยโฆษณาซึ่งมักจะไม่แตกต่างอย่างชัดเจนจากผลการค้นหา นอกจากนี้ Eitland ใน Hacker News Comments:
การคิดเกี่ยวกับมันดูเหมือนว่ามีเหตุผลว่าสำหรับเครื่องมือค้นหาที่พูดในทางปฏิบัติมีการผูกขาดทั้งในผู้ใช้และตามที่ MattGB ชี้ให้เห็น - [บาง] ปริญญาในการจัดทำดัชนี - การให้บริการคำตอบที่ถูกต้องก่อนเป็นเพียงแค่โง่: ถ้าพวกเขาสามารถทำให้ฉันไประหว่างผลการค้นหาและบล็อกเทคโนโลยี
พื้นที่ของเครื่องมือค้นหาทางเลือกได้ขยายตัวอย่างรวดเร็วในช่วงไม่กี่ปีที่ผ่านมา นี่คือรายการที่ไม่สมบูรณ์ของบางคนที่สนใจฉัน:
ในบรรดาสิ่งเหล่านี้ Yacy นั้นใกล้เคียงกับความคิดของเครื่องมือค้นหาที่ไม่แสวงหาผลกำไร ดัชนีมีการแจกจ่ายผ่านเครือข่ายแบบเพียร์ทูเพียร์ น่าเสียดายที่การตัดสินใจออกแบบนี้ทำให้การดึงผลการค้นหาช้าลง
การค้นหาชายขอบนั้นยอดเยี่ยม แต่เป้าหมายของเราแตกต่างกัน: เรามุ่งมั่นที่จะทดแทนเครื่องมือค้นหาเชิงพาณิชย์ในขณะที่ชายขอบมีจุดมุ่งหมายเพื่อให้การค้นหาประเภทอื่น
เครื่องมือค้นหาอื่น ๆ ทั้งหมดที่ฉันเคยเจอมาเพื่อผลกำไร โปรดแจ้งให้เราทราบหากฉันพลาดไปแล้ว!
ในการเป็นเครื่องมือค้นหาที่ดีเราจำเป็นต้องจัดเก็บหลายรายการ แต่ค่าใช้จ่ายในการเรียกใช้เครื่องยนต์อย่างน้อยก็เป็นสัดส่วนกับจำนวนรายการที่เก็บไว้ การพิจารณาหลักของเราคือการลดต้นทุนต่อรายการที่เก็บไว้
การออกแบบนั้นก่อตั้งขึ้นจากการสังเกตว่ารายการส่วนใหญ่จัดอันดับสำหรับชุดคำเล็ก ๆ ในเวอร์ชันสุดขั้วของสิ่งนี้ที่แต่ละรายการจัดอันดับสำหรับเทอมเดียวการออกแบบดัชนีกลับหัวปกตินั้นไม่มีประสิทธิภาพอย่างไม่มีการลดเนื่องจากเราต้องจัดเก็บแต่ละคำอย่างน้อยสองครั้ง: หนึ่งครั้งในดัชนีและหนึ่งครั้งในข้อมูลรายการเอง
การออกแบบของเราเป็นแผนที่แฮชยักษ์ เรามีร้านค้าเดียวที่ประกอบด้วยหมายเลข n คงที่ n ของหน้า แต่ละหน้ามีขนาดคงที่ (ปัจจุบัน 4096 ไบต์เพื่อให้ตรงกับหน้าหน่วยความจำ) และประกอบด้วยรายการที่บีบอัดของรายการ ด้วยคำศัพท์ที่เราต้องการให้รายการอยู่ในอันดับเราคำนวณแฮชของคำศัพท์ค่าระหว่าง 0 ถึง N - 1 รายการจะถูกเก็บไว้ในหน้าเว็บที่สอดคล้องกัน
ในการดึงหน้าเราเพียงแค่คำนวณแฮชของข้อกำหนดในแบบสอบถามผู้ใช้และโหลดหน้าเว็บที่เกี่ยวข้องกรองรายการไปยังคำที่มีคำและจัดอันดับรายการ เนื่องจากแต่ละหน้ามีขนาดเล็กจึงสามารถทำได้อย่างรวดเร็ว
เนื่องจากเราบีบอัดรายการของรายการเราจึงสามารถจัดอันดับได้มากกว่าคำเดียวและรักษาดัชนีที่เล็กกว่าการออกแบบดัชนีกลับด้าน อย่างน้อยนั่นคือทฤษฎี ความคิดนี้ยังไม่ได้รับการทดสอบในขนาดใหญ่
มีหลายวิธีที่จะช่วย:
หากคุณต้องการช่วยในวิธีใด ๆ หรือวิธีอื่น ๆ ขอบคุณ! โปรดเข้าร่วมเซิร์ฟเวอร์แชทเมทริกซ์ของเราหรือส่งอีเมลถึงผู้เขียนหลัก (ที่อยู่อีเมลอยู่ในประวัติความเป็นมาของ GIT)
สำหรับการลองใช้บริการในท้องถิ่นให้ดูที่ส่วนในหนังสือ MWMBL
หมายเหตุ: ไม่แนะนำวิธีนี้เนื่องจากมีส่วนเกี่ยวข้องมากขึ้นและดัชนีของคุณจะไม่รวมข้อมูลใด ๆ เว้นแต่คุณจะตั้งตัวรวบรวมข้อมูลเพื่อรวบรวมข้อมูลไปยังเซิร์ฟเวอร์ของคุณ คุณจะต้องตั้งค่า Backblaze ของคุณเองหรือ S3 เทียบเท่าที่เก็บข้อมูลหรือสามารถเข้าถึงคีย์การผลิตซึ่งเราอาจจะไม่ให้คุณ
ทำตามคำแนะนำการปรับใช้
เช่น "Mumble" ฉันอาศัยอยู่ใน Mumbles ซึ่งสะกดว่า "MWMBWLS" ในเวลส์ แต่ความหมายที่ตั้งใจไว้คือ "พึมพำ" เช่นเดียวกับใน "อย่าค้นหาเพียงแค่ mwmbl!"