لا إعلانات ، لا تتبع ، لا ربح
MWMBL هو محرك بحث غير ربحية مفتوح المصدر حيث يحدد المجتمع التصنيفات. نهدف إلى أن نكون بديلاً لمحركات البحث التجارية مثل Google و Bing.

لدينا فهرس خاص بنا مدعوم من مجتمعنا. يكون مؤشرنا حاليًا أصغر بكثير من محركات البحث التجارية ، مع حوالي 500 مليون عناوين URL الفريدة (المزيد من الإحصائيات). الجودة هي شوط طويل من مطابقة المحركات التجارية في الوقت الحالي ، ولكن يمكنك المساعدة في تغيير ذلك من خلال الانضمام إلينا! نحن نهدف إلى الحصول على عناوين URL الفريدة التي فهرستها بحلول نهاية عام 2024 ، و 10 مليارات بحلول نهاية عام 2025 و 100 مليار بحلول نهاية عام 2026 من هذه النقطة التي يجب أن نكون قابلة للمقارنة مع محركات البحث التجارية.
مجتمعنا الرئيسي موجود على المصفوفة ولكن لدينا أيضًا خادم Discord للمناقشة المتعلقة غير التطوير.
المجتمع مسؤول عن تزحف الويب (انظر أدناه) ونتائج البحث. نحن ودودون ومرحبون. انضم إلينا!
جميع الوثائق موجودة في https://book.mwmbl.org.
يتم توزيع الزحف في جميع أنحاء المجتمع ، في حين أن الفهرسة مركزية على الخادم الرئيسي.
إذا كان لديك قوة الكمبيوتر وعرض النطاق الترددي ، فإن أفضل طريقة يمكنك مساعدتها هي تشغيل زاحف سطر الأوامر الخاص بنا مع أكبر عدد ممكن من المواضيع.
إذا كان لديك Firefox ، فيمكنك المساعدة عن طريق تثبيت امتدادنا. هذا سوف يزحف الويب في الخلفية. لا يستخدم أو يصل إلى أي من بياناتك الشخصية. بدلاً من ذلك ، يزحف مجموعة من عناوين URL المرسلة من خادمنا المركزي. بعد استخلاص ملخص لكل صفحة ، يقوم بإعدادها ويرسل البيانات إلى الخادم المركزي لتخزينها وفهرستها.
تتعارض دوافع محركات البحث التي تمولها الإعلان مع تجربة مستخدم مثالية. تم تحسين هذه المواقع لإيرادات الإعلانات ، مع تجربة المستخدم في المركز الثاني. هذا يعني أن الصفحات محملة بالإعلانات التي لا يتم تمييزها بوضوح عن نتائج البحث. أيضا ، Eitland على تعليقات أخبار المتسلل:
التفكير في الأمر ، يبدو من المنطقي أنه بالنسبة لمحرك البحث الذي يتم احتكاره عمليًا على المستخدمين ، وكما يشير MattgB - [إلى بعض] أيضًا في الفهرسة - فإن تقديم الإجابة الصحيحة أولاً هو مجرد غبية: إذا كان بإمكانهم أن يبقوني بين نتائج البحث والمدونات التقنية مع إعلاناتهم المضمنة واحدة أو مرتين أو خمس مرات ، فهذا يعني واحدة أو خمس مرات أكثر من ذلك.
توسعت مساحة محركات البحث البديلة بسرعة في السنوات الأخيرة. إليك قائمة غير مكتملة للغاية من بعض المهتمين بي:
من بين هؤلاء ، Yacy هو الأقرب في روح لفكرة محرك بحث غير ربحية. يتم توزيع الفهرس عبر شبكة نظير إلى نظير. لسوء الحظ ، يبطئ قرار التصميم هذا جلب نتائج البحث.
Marginalia Search رائع ، لكن أهدافنا مختلفة: نهدف إلى أن نكون بديلاً لمحركات البحث التجارية في حين تهدف Marginalia إلى توفير نوع مختلف من البحث.
جميع محركات البحث الأخرى التي صادفتها هي للربح. واسمحوا لي أن أعرف إذا فاتني واحد!
لكي نكون محرك بحث جيد ، نحتاج إلى تخزين العديد من العناصر ، ولكن تكلفة تشغيل المحرك تتناسب على الأقل مع عدد العناصر المخزنة. وبالتالي ، فإن الاعتبار الرئيسي هو تقليل التكلفة لكل عنصر مخزّن.
يتم تأسيس التصميم على الملاحظة التي تشير إلى أن معظم العناصر ترتب لمجموعة صغيرة من المصطلحات. في الإصدار المتطرف من هذا ، حيث يحتل كل عنصر في تصنيف مصطلح واحد ، فإن تصميم الفهرس المقلوب المعتاد غير فعال بشكل كبير ، حيث يتعين علينا تخزين كل مصطلح على الأقل مرتين: مرة واحدة في الفهرس ومرة واحدة في بيانات العنصر نفسها.
تصميمنا هو خريطة تجزئة عملاقة. لدينا متجر واحد يتكون من عدد ثابت من الصفحات. كل صفحة ذات حجم ثابت (حاليًا 4096 بايت لمطابقة صفحة من الذاكرة) ، وتتكون من قائمة مضغوطة من العناصر. بالنظر إلى مصطلح نريد من أجله تصنيف عنصر ، نقوم بحساب تجزئة من المصطلح ، وهي قيمة بين 0 و n - 1. ثم يتم تخزين العنصر في الصفحة المقابلة.
لاسترداد الصفحات ، نقوم ببساطة بحساب تجزئة المصطلحات في استعلام المستخدم وتحميل الصفحات المقابلة ، وتصفية العناصر إلى تلك التي تحتوي على المصطلح وتصنيف العناصر. نظرًا لأن كل صفحة صغيرة ، يمكن القيام بذلك بسرعة كبيرة.
نظرًا لأننا نضغط قائمة العناصر ، يمكننا تصنيف أكثر من مصطلح واحد والحفاظ على فهرس أصغر من تصميم الفهرس المقلوب. على الأقل ، هذه هي النظرية. لم يتم اختبار هذه الفكرة بعد على نطاق واسع.
هناك طرق متعددة للمساعدة:
إذا كنت ترغب في المساعدة في أي من هذه الطرق أو غيرها ، شكرًا لك! يرجى الانضمام إلى خادم الدردشة Matrix أو إرسال بريد إلكتروني إلى المؤلف الرئيسي (عنوان البريد الإلكتروني في سجل الالتزام بالجيت).
لتجربة الخدمة محليا انظر القسم في كتاب MWMBL.
ملاحظة: لا ينصح بهذه الطريقة لأنها أكثر مشاركة ، ولن يتضمن الفهرس أي بيانات ما لم تقم بإعداد زاحف للزحف إلى الخادم الخاص بك. ستحتاج إلى إعداد سعة تخزين مكافئة لـ S3 الخاصة بك أو S3 ، أو الوصول إلى مفاتيح الإنتاج ، والتي ربما لن نقدمها لك.
اتبع تعليمات النشر
مثل "الغموض". أنا أعيش في غمغمات ، والتي تم تهجئتها "MWMBWLS" في الويلزية. لكن المعنى المقصود هو "الغموض" ، كما في "لا تبحث ، فقط MWMBL!"