blogsearch Download - blogsearch Source Code Download

blogsearch

Autre code source

1.0.0

Télécharger

Recherche de blog

Essayez-le!

BlogSearch est un outil de blogs qui permet un moteur de recherche sans aucun service externe.

C'est comme DocSearch mais pour les blogs.

Plus techniquement, BlogSearch est un pur moteur de recherche en texte complet côté client pour les sites Web statiques, alimentés par SQLite compilés sur WebAssembly.

Caractéristiques:

Recherche purement côté client
Pas de serveur à maintenir. Pas de coût de service.
Facile. Il est conçu pour les blogs et les sites Web statiques à l'esprit.
Prend en charge les cadres de blog populaires:
- Jekyll
- Gatsby
- Hugo
- … Et tous les sites Web statiques!

Projet sœur:

SQLITE-WASM: Exécutez SQLite sur le Web, en utilisant WebAssembly. Ce projet est réalisé pour les besoins de BlogSearch.

Concepts

Présentation du flux de travail

Le workflow est composé de deux étapes: 1. Vous créez un fichier d'index `.db.wasm` , puis le copiez dans le répertoire public. 2. Le moteur de la page Web lira le fichier d'index et permet la recherche.
1. Créez un fichier d'index	2. Activer la recherche
Le fichier d'index `.db.wasm` est un petit fichier de base de données qui contient le contenu de votre site Web. Vous pouvez utiliser des outils de construction d'index faciles à utiliser: Jekyll (Jekyll-BlogSearch) Gatsby (Gatsby-Plugin-BlogSearch) Hugo (BlogSearch-Crawler) Crawler générique (BlogSearch-Crawler) Ensuite, vous copiez le `.db.wasm` généré au répertoire public (où se trouve index.html) du site Web.	Votre page Web devrait charger le moteur de recherche de blogs. Il n'y a qu'un seul moteur disponible: BlogSearch Engine (BlogSearch) Chargez le moteur à l'aide de la balise <cript> ou dans le fichier javascript. Une fois que le moteur a approché correctement le fichier `.db.wasm` , vous avez maintenant une page Web consultable entièrement fonctionnelle!

Tout au long du projet, les termes "index" et "base de données" sont souvent mitigés, mais ils signifient le même fichier SQLite .db.wasm dans la plupart du cas.

1. Construire un fichier d'index de recherche

Installation d'un outil de construction d'index

Jekyll (Jekyll-BlogSearch)
Gatsby (Gatsby-Plugin-BlogSearch)
Hugo (BlogSearch-Crawler)
Crawler générique (BlogSearch-Crawler)

Qu'y a-t-il dans le fichier d'index

Les utilisateurs doivent configurer un outil de construction d'index pour collecter la valeur des champs afin de travailler correctement le moteur de recherche.

L'outil de construction d'index doit collecter les champs par défaut suivants pour chaque public:

champs

title : Le titre du Post.
body : le contenu de la publication.
url : le lien URL vers le message.
categories : une liste ( , ) des catégories auxquelles le poste appartient.
tags : une liste de balises séparées ( , ).

Les utilisateurs peuvent configurer tous les champs en utilisant les propriétés suivantes:

Tableau 1. Options communes pour le champ

Exemple	Résultat
`disabled` : si se définit `true` , désactivez complètement le champ.
{ ...other field options... categories: { + disabled: true, }, }
`hasContent` : Si Set `false` , l'outil de construction d'index ne stockera pas la valeur du champ, mais index toujours sa valeur. Cela peut être utilisé pour réduire la taille d'un fichier d'index généré par l'outil. Ceci est utile surtout lorsque la taille du contenu du champ `body` est grande. Dans l'exemple suivant, la taille du fichier d'index `.db.wasm` est diminué.
{ ...other field options... body: { + hasContent: false, }, }
`indexed` : si défini `false` , désactivez l'indexation pour le champ. Sa valeur apparaîtra toujours dans le résultat de la recherche. Il est particulièrement utile pour le champ `url` , dont la valeur n'est pas significative pour la recherche.
{ ...other field options... url: { + indexed: false, }, }

Votre outil de construction d'index peut avoir des options spécifiques à l'outil pour le champ (par exemple, l'option parser pour BlogSearch-Crawler). Voir la documentation de votre outil de construction d'index pour plus de détails.

2. Activation du moteur de recherche sur le Web

C'est aussi simple que:

 < link rel =" stylesheet " href =" https://cdn.jsdelivr.net/npm/[email protected]/dist/basic.css " />

< script src =" https://cdn.jsdelivr.net/npm/[email protected]/dist/blogsearch.umd.js " > </ script >
< script src =" https://cdn.jsdelivr.net/npm/[email protected]/dist/worker.umd.js " > </ script >

< input id =" blogsearch_input_element " type =" search " placeholder =" Search Text " class =" form-control " />

< script >
  blogsearch ( {
    dbPath : 'your_index_file.db.wasm' ,
    inputSelector : '#blogsearch_input_element' ,
  } ) ;
</ script >

Pour plus de détails et d'options, accédez au sous-répertoire de BlogSearch.

Qna

Quelle technologie de moteur de recherche utilisée dans ce projet?

Le moteur de recherche est essentiellement SQLite avec l'extension FTS5, compilé sur WebAssembly. Le SQLite FTS5 propose l'algorithme de classement BM25 intégré pour la fonctionnalité de recherche. Comme SQLite est le moteur de base de données le plus portable, vous pouvez également ouvrir tous les fichiers de base de données SQLite sur le Web! Grâce à SQLite, nous pouvons facilement écrire des plugins pour BlogSearch avec seulement quelques requêtes SQL dans différents langages de programmation.

Pourquoi `.db.wasm` est-il recommandé d'index d'extension de fichier? Ce n'est pas un fichier binaire WebAssembly. Pourquoi pas simplement `.db` ?

J'ai essayé de le faire .db mais il y a un gros problème: le fichier d'index n'est pas compressé par le serveur Web. Les services Web de blog populaires (en particulier les pages GitHub) servent généralement un fichier .db en tant application/octet-stream et ne compressent pas le fichier. En mensant qu'il s'agit d' application/wasm fichier binaire WebAssembly .wasm

La compression est importante car elle réduit considérablement la taille du fichier. J'ai vu que la taille est réduite jusqu'à 1/3.

Bâtiment de Source

Flux de travail

Pour éviter «mais cela fonctionne sur mon problème de machine», il est fortement recommandé d'utiliser Docker pour construire des tâches.

Bien que ce référentiel soit un monorepo où chaque sous-projets possède ses propres scripts de construction, vous pouvez facilement exécuter des tâches dans le répertoire racine.

Si vous souhaitez créer un sous-projet spécifique uniquement, accédez au sous-répertoire et exécutez les commandes de fil.

Les outils requis sont les suivants:

GNU Make (v4.2 ou plus est recommandé, être averti pour les utilisateurs de macOS!)
docker
composer docker
fil

Bien qu'il s'agisse d'un projet de projet JS est utilisé car il est beaucoup plus configuratble et prend en charge la construction en parallèle.

Pour les versions NodeJS spécifiques utilisées dans le projet, veuillez consulter le dockerfile.

Préparer

 # Or yarn install, without docker
make install-in-docker

Construire des bibliothèques

 # Or yarn install, without docker
make lib-in-docker

Exécuter un serveur de démonstration

make start-in-docker

# You can access the demo page via 0.0.0.0:9000

Essai

 # Or make test, without docker
make test-in-docker

# Run it in parallel
make test-in-docker -j4 --output-sync=target

Reconstruire l'exemple d'index des fichiers

️	Cela prendra beaucoup de temps! (~ 30 Mintues)

 # It is highly recommended to use docker here
make examples-in-docker && make demo-in-docker

Construisez tout

️	Cela prendra beaucoup de temps! (~ 30 Mintues)

 # Or make all, without docker
make all-in-docker

# Or

# Parallel builds. This reduces the build time almost an half on my machine.
make all-in-docker -j4 --output-sync=target

Reconstruire tout

make clean

# Then run any commands above

Entrez dans une session de bash dans le conteneur

make bash-in-docker

Crédits et licence

Ce projet est inspiré par DocSearch et a une réimplémentation de celui-ci dans TypeScript.

En dehors de cela, le projet est la licence MIT. Voir la licence

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-03-13
taille 36.02MB
Provenant de Github

Applications connexes

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout

blogsearch