blogsearch Download - blogsearch Quellcode Download

blogsearch

Anderer Quellcode

1.0.0

Herunterladen

BlogSearch

Versuchen Sie es!

BlogSearch ist ein Blogging -Tool, das eine Suchmaschine ohne externe Dienste ermöglicht.

Dies ist wie DocSearch, aber für Blogs.

Technisch gesehen ist BlogSearch eine reine clientseitige Suchmaschine mit Volltext für statische Websites, die von SQLite mit der WebAssembly kompiliert wird.

Merkmale:

Rein clientseitige Suche
Kein Server zum Verwalten. Keine Servicekosten.
Einfach. Es ist für Blogs und statische Websites erstellt.
Unterstützt beliebte Blog -Frameworks:
- Jekyll
- Gatsby
- Hugo
- … Und alle statischen Websites!

Schwesterprojekt:

SQLite-WASM: Führen Sie SQLite im Internet mit WebAssembly aus. Dieses Projekt wird für die Bedürfnisse von BlogSearch gemacht.

Konzepte

Workflow -Übersicht

Der Workflow besteht aus zwei Schritten: 1. Sie erstellen eine Indexdatei `.db.wasm` und kopieren sie dann in das öffentliche Verzeichnis. 2. Die Engine auf der Webseite liest die Indexdatei und ermöglicht die Suche.
1. Erstellen Sie eine Indexdatei	2. Aktivieren Sie die Suche
Die Indexdatei `.db.wasm` ist eine kleine Datenbankdatei, die den Inhalt Ihrer Website enthält. Sie können benutzerfreundliche Index-Bauwerkzeuge verwenden: Jekyll (Jekyll-Blogsearch) Gatsby (Gatsby-Plugin-Blogsearch) Hugo (Blogsearch-Crawler) Generisches Crawler (BlogSearch-Crawler) Anschließend kopieren Sie das generierte `.db.wasm` in das öffentliche Verzeichnis (wobei Index.html) der Website.	Ihre Webseite sollte die BlogSearch -Engine laden. Es gibt nur einen Motor: BlogSearch Engine (BlogSearch) Laden Sie die Engine mit <Script> Tag oder in JavaScript -Datei. Sobald die Engine die Datei `.db.wasm` korrekt abgerufen hat, haben Sie jetzt eine vollständig funktionierbare Webseite!

Während des gesamten Projekts werden die Begriffe "Index" und "Datenbank" oft gemischt, aber sie bedeuten, dass die gleiche SQLite .db.wasm -Datei im optimalen Fall.

1. Erstellen einer Suchindexdatei

Installieren eines Indexbuilding -Tools

Jekyll (Jekyll-Blogsearch)
Gatsby (Gatsby-Plugin-Blogsearch)
Hugo (Blogsearch-Crawler)
Generisches Crawler (BlogSearch-Crawler)

Was ist in der Indexdatei?

Benutzer sollten ein Indexbuilding -Tool konfigurieren, um den Wert der Felder zu sammeln, um die Suchmaschine ordnungsgemäß zu bearbeiten.

Das Indexbuilding -Tool sollte die folgenden Standardfelder für jeden Beitrag sammeln:

Felder

title : Der Titel des Beitrags.
body : Der Inhalt des Beitrags.
url : Der URL -Link zum Beitrag.
categories : Eine von Kommas getrennte ( , ) Liste von Kategorien, zu denen der Beitrag gehört.
tags : Eine von Kommas getrennte ( , ) Liste von Tags, die der Beitrag hat.

Benutzer können alle Felder mit den folgenden Eigenschaften konfigurieren:

Tabelle 1. Häufige Optionen für das Feld

Beispiel	Ergebnis
`disabled` : Wenn Sie `true` festlegen, deaktivieren Sie das Feld vollständig.
{ ...other field options... categories: { + disabled: true, }, }
`hasContent` : Wenn das `false` festgelegt ist, speichert das Index -Gebäude -Tool den Wert des Feldes nicht, indiziert aber dennoch seinen Wert. Dies kann verwendet werden, um die Größe einer generierten Indexdatei durch das Tool zu verringern. Dies ist nützlich, insbesondere wenn die Größe des `body` groß ist. Im folgenden Beispiel wird die Größe der Indexdatei `.db.wasm` verringert.
{ ...other field options... body: { + hasContent: false, }, }
`indexed` : Wenn Sie `false` festlegen, deaktivieren Sie die Indexierung für das Feld. Sein Wert wird im Suchergebnis weiterhin angezeigt. Es ist besonders nützlich für `url` -Feld, dessen Wert für die Suche nicht sinnvoll ist.
{ ...other field options... url: { + indexed: false, }, }

Ihr Indexbuilding-Tool Mai verfügt über Toolspezifische Optionen für das Feld (z. B. parser Option für BlogSearch-Crawler). Weitere Informationen finden Sie in der Dokumentation Ihres Indexbuilding -Tools.

2. Aktivieren Sie die Suchmaschine im Web

Es ist so einfach wie:

 < link rel =" stylesheet " href =" https://cdn.jsdelivr.net/npm/[email protected]/dist/basic.css " />

< script src =" https://cdn.jsdelivr.net/npm/[email protected]/dist/blogsearch.umd.js " > </ script >
< script src =" https://cdn.jsdelivr.net/npm/[email protected]/dist/worker.umd.js " > </ script >

< input id =" blogsearch_input_element " type =" search " placeholder =" Search Text " class =" form-control " />

< script >
  blogsearch ( {
    dbPath : 'your_index_file.db.wasm' ,
    inputSelector : '#blogsearch_input_element' ,
  } ) ;
</ script >

Weitere Details und Optionen finden Sie in das Unterverzeichnis der BlogSearch.

Qna

Welche Suchmaschinentechnologie in diesem Projekt verwendete?

Die Suchmaschine ist im Grunde genommen SQLite mit der FTS5 -Erweiterung, die mit WebAssembly zusammengestellt wird. Der SQLite FTS5 bietet den integrierten BM25-Ranking-Algorithmus für die Suchfunktionalität. Da SQLite die tragbarste Datenbank -Engine ist, können Sie auch alle SQLite -Datenbankdateien im Web öffnen! Dank SQLite können wir mit nur wenigen SQL -Abfragen in verschiedenen Programmiersprachen problemlos Plugins für BlogSearch schreiben.

Warum wird `.db.wasm` empfohlener Dateierweiterungsindex? Es ist keine Binärdatei mit WebAssembly. Warum nicht nur `.db` ?

Ich habe versucht, es zu machen .db aber es gibt ein großes Problem: Die Indexdatei wird vom Webserver nicht gzip komprimiert. Beliebte Blog-Webdienste (insbesondere Github-Seiten) bedienen normalerweise eine .db Datei als application/octet-stream und komprimieren die Datei nicht. Indem die Server sie als application/wasm erkennen und sie komprimiert werden, erkennen die Server eine Webassembly -Binärdatei .wasm

Komprimierung ist wichtig, da sie die Dateigröße erheblich reduziert. Ich habe gesehen, dass die Größe auf 1/3 reduziert ist.

Gebäude aus der Quelle

Workflow

Um zu vermeiden, dass „es auf meinem Maschinenproblem funktioniert“, wird dringend empfohlen, Docker zum Erstellen von Aufgaben zu verwenden.

Obwohl dieses Repository ein Monorepo ist, in dem jedes Unterprojekt über eigene Build -Skripte verfügt, können Sie Aufgaben im Stammverzeichnis problemlos ausführen.

Wenn Sie nur ein bestimmtes Teilprojekt erstellen möchten, gehen Sie zum Unterverzeichnis und führen Sie Garnbefehle aus.

Die erforderlichen Werkzeuge sind die folgenden:

Gnu make (v4.2 oder höher wird empfohlen, für macOS -Benutzer gewarnt werden!)
Docker
Docker-Compose
Garn

Obwohl es sich um ein JS -Projekt handelt, wird Makefile verwendet, da es viel konfigurierter ist und das Gebäude parallel unterstützt.

Für bestimmte NodeJS -Versionen, die im Projekt verwendet werden, lesen Sie bitte die Dockerfile.

Vorbereiten

 # Or yarn install, without docker
make install-in-docker

Bibliotheken bauen

 # Or yarn install, without docker
make lib-in-docker

Führen Sie einen Demo -Server aus

make start-in-docker

# You can access the demo page via 0.0.0.0:9000

Testen

 # Or make test, without docker
make test-in-docker

# Run it in parallel
make test-in-docker -j4 --output-sync=target

Beispielindexdateien neu aufbauen

Euen	Dies wird viel Zeit in Anspruch nehmen! (~ 30 Mintues)

 # It is highly recommended to use docker here
make examples-in-docker && make demo-in-docker

Bauen Sie alles

Euen	Dies wird viel Zeit in Anspruch nehmen! (~ 30 Mintues)

 # Or make all, without docker
make all-in-docker

# Or

# Parallel builds. This reduces the build time almost an half on my machine.
make all-in-docker -j4 --output-sync=target

Alles wieder aufbauen

make clean

# Then run any commands above

Steigen Sie in eine Bash -Sitzung im Container ein

make bash-in-docker

Credits & Lizenz

Dieses Projekt ist von DocSearch inspiriert und hat eine Neuauflagen in TypeScript.

Davon abgesehen ist das Projekt MIT -Lizenz. Siehe Lizenz

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-03-13
Größe 36.02MB
Kommt von Github

Ähnliche Anwendungen

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

blogsearch

BlogSearch

Konzepte

Workflow -Übersicht

1. Erstellen einer Suchindexdatei

Installieren eines Indexbuilding -Tools

Was ist in der Indexdatei?

2. Aktivieren Sie die Suchmaschine im Web

Qna

Welche Suchmaschinentechnologie in diesem Projekt verwendete?

Warum wird `.db.wasm` empfohlener Dateierweiterungsindex? Es ist keine Binärdatei mit WebAssembly. Warum nicht nur `.db` ?

Gebäude aus der Quelle

Workflow

Vorbereiten

Bibliotheken bauen

Führen Sie einen Demo -Server aus

Testen

Beispielindexdateien neu aufbauen

Bauen Sie alles

Alles wieder aufbauen

Steigen Sie in eine Bash -Sitzung im Container ein

Credits & Lizenz

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express

blogsearch

BlogSearch

Konzepte

Workflow -Übersicht

1. Erstellen einer Suchindexdatei

Installieren eines Indexbuilding -Tools

Was ist in der Indexdatei?

2. Aktivieren Sie die Suchmaschine im Web

Qna

Welche Suchmaschinentechnologie in diesem Projekt verwendete?

Warum wird .db.wasm empfohlener Dateierweiterungsindex? Es ist keine Binärdatei mit WebAssembly. Warum nicht nur .db ?

Gebäude aus der Quelle

Workflow

Vorbereiten

Bibliotheken bauen

Führen Sie einen Demo -Server aus

Testen

Beispielindexdateien neu aufbauen

Bauen Sie alles

Alles wieder aufbauen

Steigen Sie in eine Bash -Sitzung im Container ein

Credits & Lizenz

Warum wird `.db.wasm` empfohlener Dateierweiterungsindex? Es ist keine Binärdatei mit WebAssembly. Warum nicht nur `.db` ?