هذا هو الكود المصدري للبحث في Marginalia.
الهدف من المشروع هو تطوير طرق اكتشاف جديدة وبديلة للإنترنت. إنها ورشة تجريبية بقدر ما هي خدمة عامة ، والهدف الشامل هو رفع الجوانب البشرية وغير التجارية للإنترنت.
يتمثل الهدف الجانبي في القيام بذلك دون الحاجة إلى مراكز بيانات وميزانيات أجهزة المؤسسات ، لتكون قادرة على تشغيل هذه العملية على أجهزة بأسعار معقولة مع الحد الأدنى من التشغيل العام.
تتمثل الخطة الطويلة الأجل في تحسين محرك البحث بحيث توفر قيمة عامة كافية يمكن تمويل المشروع من خلال المنح والتبرعات وتراخيص API التجارية (لا يمكن دائمًا حدوث حصة غير تجارية).
يمكن تشغيل النظام كنسخة من Marginalia Search ، أو كمحرك بحث أبيض للبيانات الخاصة بك (إما الزحف أو التحميل الجانبي). في الوقت الحاضر ، لا يمكن تكوين المنطق ، ويستند الكثير من الأحكام المصدرة إلى أهداف مشروع Marginalia ، ولكن يتم إجراء تكوين إضافي!
إليك عرضًا تجريبيًا لإعداد وتشغيل الوضع العاري المستضيف ذاتيًا لمحرك البحث :؟ https://www.youtube.com/watch؟v=pnwmkenq24
لإعداد بيئة اختبار محلية ، اتبع التعليمات في؟ تشغيل/readme.md!
المزيد من الوثائق متوفرة في؟ https://docs.marginalia.nu/.
قبل التجميع ، من الضروري تشغيل/setup.sh. سيؤدي ذلك إلى تنزيل بيانات النموذج التكميلي الضروري لتشغيل الرمز. هذه ضرورية أيضًا لتشغيل الاختبارات.
إذا كنت ترغب في اختراق الرمز ، تحقق من؟ DOC/IDE-Configuration.MD.
تتطلب بيئة تشبه الإنتاج الكثير من ذاكرة الوصول العشوائي و SSDs للمؤسسات المثالية للمؤشر ، بالإضافة إلى بعض terabytes الإضافية من الأبطال البطيئة لتخزين بيانات الزحف. يمكن أن يتم تشغيله على أجهزة أصغر عن طريق الحد من حجم الفهرس.
سيتم تشغيل النظام بالتأكيد على جهاز 32 جيجابايت ، وربما أصغر ، ولكن في هذا الحجم قد لا يعمل بشكل جيد للغاية لأنه يعتمد على التخزين المؤقت للقرص ليكون سريعًا.
من الممكن أن يكون نشر المطور المحلي مع أجهزة أصغر بكثير (وحجم الفهرس).
؟ رمز/ - رمز المصدر. يرى ؟ رمز/readme.md لمزيد من الانهيار للهيكل والهندسة المعمارية.
؟ تشغيل/ - البرامج النصية والملفات المستخدمة لتشغيل محرك البحث محليًا
؟ طرف ثالث/ - رمز الطرف الثالث
؟ DOC/ - الوثائق التكميلية
؟ المساهمة. MD - كيفية المساهمة
؟ ترخيص.
يمكنك إرسال بريد إلكتروني إلى [email protected] مع أي أسئلة أو تعليقات.
الجزء الأكبر من المشروع متاح مع AGPL 3.0 ، مع استثناءات. بعض الأجزاء مرخصة بموجب معهد ماساتشوستس للتكنولوجيا ، قد يكون لدولة الطرف الثالث تراخيص مختلفة. انظر README.MD / الترخيص المناسبة.
يستخدم المشروع إصدار تقويم معدّل ، حيث يتزامن أول اثنين من الأرقام من الأرقام لمدة عام وشهر مع أحدث عملية الزحف ، والرقم الثالث هو رقم التصحيح.
version
--
yy.mm.VV
-----
crawl
على سبيل المثال ، 23.03.02 هو إصدار مع بيانات الزحف من مارس 2023 (صدر في مايو 2023). هذا هو التصحيح الثاني لإصدار 23.02.
تتوافق الإصدارات التي تحتوي على نفس العام والشهر مع بعضها البعض ، أو توفر مسارًا ترقية حيث يمكن استخدام مجموعة البيانات نفسها ، ولكن قد يتم تقديم تغييرات تنسيق البيانات عبر مجموعات البيانات المختلفة ، ومن المتوقع عمومًا إعادة صياغة البيانات من نقطة الصفر لأن بيانات الزحف لها عمرها تقريبًا طالما كانت دورات الإصدار الرئيسية في هذا المشروع. بعد حوالي 2-3 أشهر ، يصبح الأمر قادمًا بشكل ملحوظ مع العديد من الروابط الميتة.
لأغراض التطوير ، يتم تثبيط الزحف ويتوفر بيانات العينة. يرى ؟ تشغيل/readMe.md لمزيد من المعلومات.
النظر في التبرع للمشروع.
تم تمويل هذا المشروع من خلال صندوق NGI0 Enterrust Fund ، وهو صندوق أنشأته NLNET بدعم مالي من برنامج الجيل القادم من المفوضية الأوروبية ، بموجب AEGIS لشبكات الاتصالات ، المحتوى والتكنولوجيا بموجب اتفاقية المنحة رقم 101069594.