Mini Site Searcher เป็นตัวสร้างดัชนีเว็บไซต์และเครื่องมือค้นหาที่เรียบง่าย ซึ่งจะรวบรวมข้อมูลและแคชเนื้อหาในเว็บไซต์ของคุณโดยอัตโนมัติ และจัดให้มีฟังก์ชันการค้นหาผ่าน REST API
สามารถใช้เพื่อจัดเตรียมฟังก์ชันการค้นหาสำหรับบล็อกไซต์แบบคงที่ หรือเพื่อสร้างฐานความรู้ส่วนบุคคลที่สามารถค้นหาได้...
ขั้นแรก คุณต้องสร้างไฟล์ .env เพื่ออธิบายวิธีการตั้งค่าโปรแกรมรวบรวมข้อมูล
ตัวอย่างเช่น ด้วยการกำหนดค่าต่อไปนี้ เราต้องการตั้งค่าตัวสร้างดัชนีสำหรับเว็บไซต์ที่ https://my.blog โปรแกรมรวบรวมข้อมูลจะเริ่มดูที่หน้า https://my.blog/index.html และค้นหาทั้งหมด ลิงก์ที่มี /posts ใน URL ดังนั้นตัวเลือก CSS ควรเป็น a[href*=/posts] และเมื่อติดตามแต่ละลิงก์ โปรแกรมรวบรวมข้อมูลจะได้รับเนื้อหาข้อความของแท็ก <article class="main-content">
BASE_URL="https://my.blog"
ENTRY_POINT="https://my.blog/index.html"
LINK_SEARCH_PATTERN="a[href*='/posts']"
MAIN_CONTENT_PATTERN="article.main-content"
จากนั้นรันเซิร์ฟเวอร์:
cargo run
หลังจากเริ่มต้น โปรแกรมรวบรวมข้อมูลจะเริ่มทำงานและอาจใช้เวลาสักครู่ในการจัดทำดัชนีให้เสร็จสิ้น REST API จะถูกให้บริการที่พอร์ตเริ่มต้น 3366 หรืออะไรก็ตามในตัวแปรสภาพแวดล้อม PORT ของคุณ หากต้องการค้นหา ให้ส่งคำขอ GET ดังนี้:
GET /?keyword=<something>
โปรแกรมมีสององค์ประกอบ:
