นี่คือซอร์สโค้ดสำหรับการค้นหาชายขอบ
เป้าหมายของโครงการคือการพัฒนาวิธีการค้นพบใหม่และทางเลือกสำหรับอินเทอร์เน็ต มันเป็นเวิร์กช็อปทดลองมากเท่ากับการบริการสาธารณะเป้าหมายที่ครอบคลุมคือการยกระดับด้านมนุษย์ที่ไม่ใช่เชิงพาณิชย์ของอินเทอร์เน็ตมากขึ้น
เป้าหมายด้านข้างคือการทำสิ่งนี้โดยไม่ต้องใช้ดาต้าเซ็นเตอร์และงบประมาณฮาร์ดแวร์ขององค์กรเพื่อให้สามารถดำเนินการนี้ด้วยฮาร์ดแวร์ราคาไม่แพงที่มีค่าใช้จ่ายในการดำเนินงานน้อยที่สุด
แผนระยะยาวคือการปรับแต่งเครื่องมือค้นหาเพื่อให้มีมูลค่าสาธารณะเพียงพอที่โครงการสามารถได้รับเงินทุนผ่านทุนการบริจาคและใบอนุญาต API เชิงพาณิชย์
ทั้งระบบสามารถเรียกใช้เป็นสำเนาของการค้นหาชายขอบหรือเป็นเครื่องมือค้นหาฉลากสีขาวสำหรับข้อมูลของคุณเอง (ทั้งคลานหรือโหลดด้านข้าง) ในปัจจุบันตรรกะไม่สามารถกำหนดค่าได้มากและการตัดสินจำนวนมากขึ้นอยู่กับเป้าหมายของโครงการชายขอบ แต่กำลังกำหนดค่าเพิ่มเติม!
นี่คือการสาธิตการตั้งค่าและการทำงานของโหมด Barebones ที่เป็นที่ยอมรับของตัวเองของเครื่องมือค้นหา:? https://www.youtube.com/watch?v=PNWMKENQQ24
หากต้องการตั้งค่าสภาพแวดล้อมการทดสอบในท้องถิ่นทำตามคำแนะนำใน? run/readme.md!
มีเอกสารเพิ่มเติมที่? https://docs.marginalia.nu/
ก่อนที่จะรวบรวมจำเป็นต้องเรียกใช้ Run/Setup.sh สิ่งนี้จะดาวน์โหลดข้อมูลโมเดลเสริมที่จำเป็นในการเรียกใช้รหัส สิ่งเหล่านี้จำเป็นต่อการทดสอบ
หากคุณต้องการแฮ็ครหัสให้ลองดูไหม DOC/IDE-Configuration.md
สภาพแวดล้อมที่มีลักษณะคล้ายการผลิตต้องใช้ RAM จำนวนมากและ SSD ขององค์กรที่ดีที่สุดสำหรับดัชนีรวมถึงเทราไบต์เพิ่มเติมของฮาร์ดไดรฟ์ที่ช้ากว่าสำหรับการจัดเก็บข้อมูลการรวบรวมข้อมูล มันสามารถทำเพื่อทำงานบนฮาร์ดแวร์ขนาดเล็กโดย จำกัด ขนาดของดัชนี
ระบบจะทำงานบนเครื่อง 32 GB อย่างแน่นอนอาจมีขนาดเล็กลง แต่ในขนาดนั้นมันอาจไม่ทำงานได้ดีมากเนื่องจากต้องอาศัยการแคชดิสก์ให้เร็ว
การปรับใช้ของนักพัฒนาซอฟต์แวร์ในพื้นที่นั้นเป็นไปได้ด้วยฮาร์ดแวร์ที่เล็กกว่ามาก (และขนาดดัชนี)
- รหัส/ - ซอร์สโค้ด ดู ? รหัส/readme.md สำหรับการแยกโครงสร้างและสถาปัตยกรรมเพิ่มเติม
- เรียกใช้/ - สคริปต์และไฟล์ที่ใช้ในการเรียกใช้เครื่องมือค้นหาในเครื่อง
- บุคคลที่สาม/ - รหัสบุคคลที่สาม
- เอกสาร/ - เอกสารเสริม
- Inturning.md - วิธีการมีส่วนร่วม
- license.md - ข้อกำหนดใบอนุญาต
คุณสามารถส่งอีเมล [email protected] ด้วยคำถามหรือข้อเสนอแนะใด ๆ
ส่วนใหญ่ของโครงการมีให้กับ AGPL 3.0 โดยมีข้อยกเว้น บางส่วนได้รับใบอนุญาตร่วมภายใต้ MIT รหัสบุคคลที่สามอาจมีใบอนุญาตที่แตกต่างกัน ดู readme.md / license.md ที่เหมาะสม
โครงการใช้การกำหนดเวอร์ชันปฏิทินที่ปรับเปลี่ยนซึ่งตัวเลขสองคู่แรกเป็นหนึ่งปีและเดือนตรงกับการดำเนินการคลานล่าสุดและหมายเลขที่สามคือหมายเลขแพทช์
version
--
yy.mm.VV
-----
crawl
ตัวอย่างเช่น 23.03.02 เป็นการเปิดตัวพร้อมข้อมูลการรวบรวมข้อมูลตั้งแต่เดือนมีนาคม 2566 (เปิดตัวในเดือนพฤษภาคม 2566) มันเป็นแพตช์ที่สองสำหรับการเปิดตัว 23.02
เวอร์ชันที่มีปีและเดือนเดียวกันนั้นเข้ากันได้กับกันและกันหรือเสนอเส้นทางการอัพเกรดที่สามารถใช้ชุดข้อมูลเดียวกันได้ แต่ในการรวบรวมรูปแบบการรวบรวมข้อมูลที่แตกต่างกันอาจมีการเปลี่ยนแปลงรูปแบบข้อมูลและโดยทั่วไปคุณคาดว่าจะรวบรวมข้อมูลอีกครั้ง หลังจากผ่านไปประมาณ 2-3 เดือนมันจะค้างอย่างเห็นได้ชัดพร้อมกับลิงก์ที่ตายแล้วจำนวนมาก
เพื่อวัตถุประสงค์ในการพัฒนาการรวบรวมข้อมูลจะหมดกำลังใจและมีข้อมูลตัวอย่าง ดู ? run/readme.md สำหรับข้อมูลเพิ่มเติม
พิจารณาบริจาคให้กับโครงการ
โครงการนี้ได้รับเงินทุนผ่าน NGI0 Entrust Fund ซึ่งเป็นกองทุนที่จัดตั้งขึ้นโดย NLNET ด้วยการสนับสนุนทางการเงินจากโครงการอินเทอร์เน็ตรุ่นต่อไปของคณะกรรมาธิการยุโรปภายใต้ Aegis ของ DG Communications Networks เนื้อหาและเทคโนโลยีภายใต้ข้อตกลงการให้สิทธิ์หมายเลข 101069594