Скачать blogsearch - Загрузка исходного кода blogsearch

blogsearch

Другой исходный код

1.0.0

Скачать

Blogsearch

Попробуйте!

BlogSearch - это инструмент для ведения блога, который позволяет поисковой системе без каких -либо внешних служб.

Это как DocSearch, но для блогов.

Более технически, BlogSearch является чистой клиентской, полнотекстовой поисковой системой для статических веб-сайтов, включенной в SQLite, составленную в Webassembly.

Функции:

Чисто клиентский поиск
Нет сервера для обслуживания. Нет стоимости обслуживания.
Легкий. Он создан для блогов и статических веб -сайтов.
Поддерживает популярные фреймворки в блоге:
- Джекилл
- Гэтсби
- Гюго
- ... и любые статические сайты!

Сестринский проект:

SQLite-Wasm: запустите SQLite в Интернете, используя WebAssembly. Этот проект создан для потребностей BlogSearch.

Концепции

Обзор рабочего процесса

Рабочий процесс состоит из двух шагов: 1. Вы создаете индексный файл `.db.wasm` , затем копируете его в публичный каталог. 2. Двигатель на веб -странице будет читать файл индекса и позволяет поиск.
1. Создайте индексный файл	2. Включить поиск
Индексный файл `.db.wasm` - это небольшой файл базы данных, который содержит содержимое вашего веб -сайта. Вы можете использовать простые в использовании инструменты строительства индекса: Jekyll (Jekyll-Blogsearch) Gatsby (Gatsby-Plugin-Blogsearch) Hugo (Blogsearch-Crawler) Общий гусениц (Blogsearch-Crawler) Затем вы копируете сгенерированный `.db.wasm` в публичный каталог (где index.html расположен) на веб -сайте.	Ваша веб -страница должна загрузить двигатель BlogSearch. Доступен только один двигатель: Двигатель Blogsearch (Blogsearch) Загрузите двигатель, используя <Script> тег или в файл JavaScript. После того, как двигатель правильно принесет файл `.db.wasm` , теперь у вас есть полностью работающая веб -страница, доступная для поиска!

На протяжении всего проекта термины «индекс» и «база данных» часто смешаны, но они означают один и тот же файл sqlite .db.wasm в большинстве случаев.

1. Создание файла индекса поиска

Установка инструмента для строительства индекса

Jekyll (Jekyll-Blogsearch)
Gatsby (Gatsby-Plugin-Blogsearch)
Hugo (Blogsearch-Crawler)
Общий гусениц (Blogsearch-Crawler)

Что в файле индекса

Пользователи должны настроить инструмент индекса построения для сбора значения полей для правильной работы поисковой системы.

Индексный инструмент строительства должен собирать следующие поля по умолчанию для каждой посты:

поля

title : Название поста.
body : содержание поста.
url : URL -ссылка на сообщение.
categories : разделенный запятой ( , ) список категорий, к которым принадлежит пост.
tags : разделенный запятой ( , ) список тегов, которые есть в сообщении.

Пользователи могут настроить все поля, используя следующие свойства:

Таблица 1. Общие опции для поля

Пример	Результат
`disabled` : если установить `true` , полностью отключите поле.
{ ...other field options... categories: { + disabled: true, }, }
`hasContent` : если установлен `false` , инструмент для строительства индекса не будет хранить значение поля, но все же индексирует его значение. Это может быть использовано для уменьшения размера сгенерированного индексного файла инструментом. Это полезно, особенно когда размер содержания поля `body` велик. В следующем примере размер индексного файла `.db.wasm` уменьшается.
{ ...other field options... body: { + hasContent: false, }, }
`indexed` : Если установлено `false` , отключите индексацию для поля. Его значение все еще будет появляться в результатах поиска. Это особенно полезно для поля `url` , значение которой не имеет значения для поиска.
{ ...other field options... url: { + indexed: false, }, }

Ваш инструмент для построения индекса может иметь специфичные для инструмента варианты для этой области (например, вариант parser для BlogSearch-Crawler). Подробнее см. Документацию вашего инструмента построения индекса.

2. Включение поисковой системы в Интернете

Это так же просто, как:

 < link rel =" stylesheet " href =" https://cdn.jsdelivr.net/npm/[email protected]/dist/basic.css " />

< script src =" https://cdn.jsdelivr.net/npm/[email protected]/dist/blogsearch.umd.js " > </ script >
< script src =" https://cdn.jsdelivr.net/npm/[email protected]/dist/worker.umd.js " > </ script >

< input id =" blogsearch_input_element " type =" search " placeholder =" Search Text " class =" form-control " />

< script >
  blogsearch ( {
    dbPath : 'your_index_file.db.wasm' ,
    inputSelector : '#blogsearch_input_element' ,
  } ) ;
</ script >

Для получения дополнительной информации и опций перейдите в подкаталог BlogSearch.

QNA

Какие технологии поисковой системы использовались в этом проекте?

Поисковая система в основном представляет собой SQLite с расширением FTS5, составленной в WebAssembly. SQLite FTS5 предлагает встроенный алгоритм ранжирования BM25 для функциональности поиска. Поскольку SQLite является наиболее портативным двигателем базы данных, вы также можете открыть любые файлы базы данных SQLite в Интернете! Благодаря SQLite, мы можем легко написать плагины для BlogSearch с несколькими запросами SQL на разных языках программирования.

Почему `.db.wasm` - это рекомендуемый индекс расширения файла? Это не двоичный файл webassembly. Почему бы не только `.db` ?

Я попытался сделать это .db , но есть большая проблема: файл индекса не сжата Gzip веб-сервером. Популярные веб-сервисы блога (особенно страницы Github) обычно обслуживают файл .db в качестве application/octet-stream и не сжимают файл. Ложь, что это двоичный файл webassembly .wasm , серверы распознают его как application/wasm и отправляют его сжатый.

Сжатие важно, потому что оно значительно уменьшает размер файла. Я увидел, что размер уменьшен до 1/3.

Здание из источника

Рабочий процесс

Чтобы избежать «но это работает на моей машине», настоятельно рекомендуется использовать Docker для строительства задач.

Хотя этот репозиторий является монорепо, где у каждого подпроекта есть собственные сценарии сборки, вы можете легко выполнять задачи в корневом каталоге.

Если вы хотите построить только конкретный субпроект, перейдите в подкаталог и запустите команды пряжи.

Требуемые инструменты являются следующими:

GNU Make (v4.2 или выше рекомендуется, будьте осторожны для пользователей MacOS!)
докер
докер-состав
пряжа

Хотя это используется Makefile Project JS, потому что он гораздо более конфигурируется и поддерживает здание параллельно.

Для конкретных версий Nodejs, используемых в проекте, пожалуйста, посмотрите на Dockerfile.

Подготовить

 # Or yarn install, without docker
make install-in-docker

Создать библиотеки

 # Or yarn install, without docker
make lib-in-docker

Запустить демонстрационный сервер

make start-in-docker

# You can access the demo page via 0.0.0.0:9000

Тестирование

 # Or make test, without docker
make test-in-docker

# Run it in parallel
make test-in-docker -j4 --output-sync=target

Восстановление примеров индексных файлов

️	Это займет много времени! (~ 30 мятетов)

 # It is highly recommended to use docker here
make examples-in-docker && make demo-in-docker

Построить все

️	Это займет много времени! (~ 30 мятетов)

 # Or make all, without docker
make all-in-docker

# Or

# Parallel builds. This reduces the build time almost an half on my machine.
make all-in-docker -j4 --output-sync=target

Восстановите все

make clean

# Then run any commands above

Попасть в сеанс Bash в контейнере

make bash-in-docker

Кредиты и лицензия

Этот проект вдохновлен DocSearch и имеет его переосмысление в TypeScript.

Кроме этого, проект является лицензией MIT. Смотрите лицензию

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-03-13
размер 36.02MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

blogsearch

Blogsearch

Концепции

Обзор рабочего процесса

1. Создание файла индекса поиска

Установка инструмента для строительства индекса

Что в файле индекса

2. Включение поисковой системы в Интернете

QNA

Какие технологии поисковой системы использовались в этом проекте?

Почему `.db.wasm` - это рекомендуемый индекс расширения файла? Это не двоичный файл webassembly. Почему бы не только `.db` ?

Здание из источника

Рабочий процесс

Подготовить

Создать библиотеки

Запустить демонстрационный сервер

Тестирование

Восстановление примеров индексных файлов

Построить все

Восстановите все

Попасть в сеанс Bash в контейнере

Кредиты и лицензия

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express

blogsearch

Blogsearch

Концепции

Обзор рабочего процесса

1. Создание файла индекса поиска

Установка инструмента для строительства индекса

Что в файле индекса

2. Включение поисковой системы в Интернете

QNA

Какие технологии поисковой системы использовались в этом проекте?

Почему .db.wasm - это рекомендуемый индекс расширения файла? Это не двоичный файл webassembly. Почему бы не только .db ?

Здание из источника

Рабочий процесс

Подготовить

Создать библиотеки

Запустить демонстрационный сервер

Тестирование

Восстановление примеров индексных файлов

Построить все

Восстановите все

Попасть в сеанс Bash в контейнере

Кредиты и лицензия

Почему `.db.wasm` - это рекомендуемый индекс расширения файла? Это не двоичный файл webassembly. Почему бы не только `.db` ?