Mini Site Searcher — это простой индексатор и поисковая система сайта, которая автоматически сканирует и кэширует содержимое вашего веб-сайта, а также предоставляет функции поиска через REST API.
Его можно использовать для обеспечения функции поиска в блогах статических сайтов или для создания доступной для поиска базы личных знаний...
Во-первых, вам нужно создать файл .env , чтобы описать, как вы хотите настроить искатель.
Например, в следующей конфигурации мы хотим настроить индексатор для веб-сайта https://my.blog , сканер начнет просматривать страницу https://my.blog/index.html и найдет все ссылка, URL-адрес которой имеет /posts , поэтому селектором CSS для нее должен быть a[href*=/posts] . И при переходе по каждой ссылке сканер получит текстовое содержимое любых тегов <article class="main-content"> .
BASE_URL="https://my.blog"
ENTRY_POINT="https://my.blog/index.html"
LINK_SEARCH_PATTERN="a[href*='/posts']"
MAIN_CONTENT_PATTERN="article.main-content"
Затем запустите сервер:
cargo run
После запуска сканер запустится, и завершение индексации может занять некоторое время. REST API также будет обслуживаться через порт по умолчанию 3366 или любой другой порт в вашей переменной среды PORT . Для поиска сделайте запрос GET следующим образом:
GET /?keyword=<something>
Программа состоит из двух компонентов:
