Download do blogsearch - Download do código -fonte blogsearch

blogsearch

Outro código-fonte

1.0.0

Baixar

BlogSearch

Experimente!

O BlogSearch é uma ferramenta de blog que permite um mecanismo de pesquisa sem serviços externos.

É como o DocSearch, mas para blogs.

Mais tecnicamente, o BlogSearch é um mecanismo de pesquisa de texto completo puro do cliente para sites estáticos, alimentados pelo SQLite compilado à WebAssembly.

Características:

Pesquisa puramente do lado do cliente
Nenhum servidor para manter. Sem custo de serviço.
Fácil. É construído para blogs e sites estáticos em mente.
Suporta estruturas populares de blog:
- Jekyll
- Gatsby
- Hugo
- … E quaisquer sites estáticos!

Projeto Sister:

SQLITE-WASM: Execute o SQLite na web, usando o WebAssembly. Este projeto é feito para as necessidades do BlogSearch.

Conceitos

Visão geral do fluxo de trabalho

O fluxo de trabalho é consistente em duas etapas: 1. Você constrói um arquivo de índice `.db.wasm` e copie -o para o diretório público. 2. O mecanismo na página da Web lerá o arquivo de índice e ativará a pesquisa.
1. Construa um arquivo de índice	2. Habilite a pesquisa
O arquivo de índice `.db.wasm` é um pequeno arquivo de banco de dados que contém o conteúdo do seu site. Você pode usar ferramentas de construção de índices fáceis de usar: Jekyll (Jekyll-BlogSearch) Gatsby (Gatsby-Plugin-BlogSearch) Hugo (BlogSearch-Crawler) Rastreador genérico (BlogSearch-Crawler) Em seguida, você copia o `.db.wasm` gerado para o diretório público (onde index.html localizado) do site.	Sua página da web deve carregar o mecanismo do BlogSearch. Existe apenas um motor disponível: Mecanismo de pesquisa blog (blogsearch) Carregue o mecanismo usando a tag <Cript> ou no arquivo JavaScript. Quando o motor buscar o arquivo `.db.wasm` corretamente, agora você tem uma página da Web pesquisável totalmente profissional!

Ao longo do projeto, os termos "índice" e "banco de dados" são frequentemente misturados, mas eles significam o mesmo arquivo sqlite .db.wasm na maior parte do caso.

1. Construindo um arquivo de índice de pesquisa

Instalando uma ferramenta de construção de índice

Jekyll (Jekyll-BlogSearch)
Gatsby (Gatsby-Plugin-BlogSearch)
Hugo (BlogSearch-Crawler)
Rastreador genérico (BlogSearch-Crawler)

O que está no arquivo de índice

Os usuários devem configurar uma ferramenta de construção de índice para coletar o valor dos campos para trabalhar corretamente no mecanismo de pesquisa.

A ferramenta de construção de índices deve coletar os seguintes campos padrão para cada postagem:

campos

title : O título do post.
body : o conteúdo da postagem.
url : O link URL para o post.
categories : Uma lista de categorias ( , ) separada por vírgula a que o post pertence.
tags : uma lista de tags ( , ) separada por vírgula que a postagem possui.

Os usuários podem configurar todos os campos usando as seguintes propriedades:

Tabela 1. Opções comuns para o campo

Exemplo	Resultado
`disabled` : Se `true` , desative completamente o campo.
{ ...other field options... categories: { + disabled: true, }, }
`hasContent` : se definido `false` , a ferramenta de construção de índices não armazenará o valor do campo, mas ainda indexa seu valor. Isso pode ser usado para reduzir o tamanho de um arquivo de índice gerado pela ferramenta. Isso é útil, especialmente quando o tamanho do conteúdo do campo `body` é grande. No exemplo a seguir, o tamanho do arquivo de índice `.db.wasm` diminui.
{ ...other field options... body: { + hasContent: false, }, }
`indexed` : se definido `false` , desative a indexação para o campo. Seu valor ainda aparecerá no resultado da pesquisa. É especialmente útil para o campo `url` , cujo valor não é significativo para a pesquisa.
{ ...other field options... url: { + indexed: false, }, }

Sua ferramenta de construção de índices pode ter opções específicas da ferramenta para o campo (por exemplo, opção parser para o blogsearch-crawler). Consulte a documentação da sua ferramenta de construção de índices para obter detalhes.

2. Habilitando o mecanismo de pesquisa na web

É tão simples quanto:

 < link rel =" stylesheet " href =" https://cdn.jsdelivr.net/npm/[email protected]/dist/basic.css " />

< script src =" https://cdn.jsdelivr.net/npm/[email protected]/dist/blogsearch.umd.js " > </ script >
< script src =" https://cdn.jsdelivr.net/npm/[email protected]/dist/worker.umd.js " > </ script >

< input id =" blogsearch_input_element " type =" search " placeholder =" Search Text " class =" form-control " />

< script >
  blogsearch ( {
    dbPath : 'your_index_file.db.wasm' ,
    inputSelector : '#blogsearch_input_element' ,
  } ) ;
</ script >

Para obter mais detalhes e opções, vá para o subdiretório do BlogSearch.

QNA

Qual tecnologia de mecanismo de pesquisa usada neste projeto?

O mecanismo de pesquisa basicamente é o sqlite com a extensão FTS5, compilada ao WebAssembly. O SQLITE FTS5 oferece o algoritmo de classificação BM25 embutido para a funcionalidade de pesquisa. Como o SQLite é o mecanismo de banco de dados mais portátil, você também pode abrir qualquer arquivo de banco de dados SQLite na Web! Graças ao SQLite, podemos escrever plugins facilmente para o BlogSearch com apenas algumas consultas SQL em diferentes linguagens de programação.

Por que `.db.wasm` é recomendado Índice de Extensão de Arquivos? Não é um arquivo binário da WebAssembly. Por que não apenas `.db` ?

Tentei fazê-lo .db , mas há um grande problema: o arquivo de índice não é compactado pelo servidor da web. Os Serviços Populares da Web do blog (especialmente as páginas do GitHub) geralmente servem um arquivo .db como application/octet-stream e não comprimem o arquivo. Ao mentir de que é um arquivo binário da WebAssembly .wasm , os servidores o reconhecem como application/wasm e o enviam comprimidos.

A compactação é importante porque reduz significativamente o tamanho do arquivo. Vi que o tamanho é reduzido para 1/3.

Edifício da fonte

Fluxo de trabalho

Para evitar o problema "mas funciona na minha máquina", é fortemente recomendável usar o Docker para criar tarefas.

Embora esse repositório seja um monorepo, onde cada subprojetos possui scripts de construção própria, você pode executar facilmente tarefas no diretório raiz.

Se você deseja criar apenas um subproject específico, vá para o subdiretório e execute os comandos de fios.

As ferramentas necessárias são as seguintes:

GNU Make (v4.2 ou superior é recomendado, seja avisado para os usuários do macOS!)
Docker
Docker-Compose
fio

Embora seja um projeto JS Makefile é usado porque é muito mais configurável e suporta a construção em paralelo.

Para versões específicas do NodeJS usadas no projeto, consulte o Dockerfile.

Preparar

 # Or yarn install, without docker
make install-in-docker

Construir bibliotecas

 # Or yarn install, without docker
make lib-in-docker

Execute um servidor de demonstração

make start-in-docker

# You can access the demo page via 0.0.0.0:9000

Teste

 # Or make test, without docker
make test-in-docker

# Run it in parallel
make test-in-docker -j4 --output-sync=target

Reconstruir arquivos de índice de exemplo

️	Isso levará muito tempo! (~ 30 mintas)

 # It is highly recommended to use docker here
make examples-in-docker && make demo-in-docker

Construir tudo

️	Isso levará muito tempo! (~ 30 mintas)

 # Or make all, without docker
make all-in-docker

# Or

# Parallel builds. This reduces the build time almost an half on my machine.
make all-in-docker -j4 --output-sync=target

Reconstruir tudo

make clean

# Then run any commands above

Entre em uma sessão de basquete no contêiner

make bash-in-docker

Créditos e licença

Este projeto é inspirado no DocSearch e possui uma reimplementação no TypeScript.

Fora isso, o projeto é a licença do MIT. Consulte a licença

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-03-13
tamanho 36.02MB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos

blogsearch