TLGS ist eine Suchmaschine für Gemini. Es ist leicht übergieft für das, was es derzeit ist, und verwendet seltsame Technologie. Und ich bin stolz darauf. Der aktuelle Code Basse ist ein bisschen chaotisch - ich verspreche, sie aufzuräumen. Die Hauptmerkmale/Eigenschaften sind wie folgt:
Ab sofort sind die Indexierung von Nachrichtenseiten, RFCs und Dokumentationen größtenteils deaktiviert. Aber wahrscheinlich aktiviert werden, sobald ich den Mittelwert und die Ressourcen habe, um das Setup zu skalieren.
Das Projekt aufbauen. Sie benötigen einen vollständig C ++ 20 -fähigen Compiler. Die folgenden Compiler sollten nach dem Schreiben dieses ReadMe arbeiten
Installieren Sie alle Abhängigkeiten. Und führen Sie die Befehle aus:
mkdir build
cd build
cmake ..
make -jUm den Initalindex zu erstellen:
./tlgs/tlgs_ctl/tlgs_ctl ../tlgs/config.json populate_schemaseeds.text./tlgs/crawler/tlgs_crawler -s seeds.text -c 4 ../tlgs/config.jsonJetzt wird der Crawler beginnen, den Geminispace zu kriechen und gleichzeitig veraltete Indizes zu aktualisieren (falls vorhanden). Um einen vorhandenen Index zu aktualisieren. Laufen:
./tlgs/crawler/tlgs_crawler -c 2 ../tlgs/config.json
# -c is the maximum concurrent connections the crawler will makeHinweis: Der Crawler von TLGS ist verteilbar. Sie können mehrere Instanzen parallel ausführen. Aber einige Intschaften können gegen Ende oder Kriechen früh ausgehen. Obwohl es nicht das Ergebnis des Krabbelns beeinflusst.
openssl req -new -subj " /CN=my.host.name.space " -x509 -newkey ec -pkeyopt ec_paramgen_curve:prime256v1 -days 36500 -nodes -out cert.pem -keyout key.pem
cd tlgs/server
./tlgs_server ../../../tlgs/server_config.jsonsudo systemctl start tlgs_server
sudo systemctl start tlgs_crawler Der Abschnitt custom_config.tlgs in search_config.json (installiert unter /etc/tlgs/server_config.json ) enthält Kongressbekämpfungen für den TLGS -Server. Neben den üblichen Konfigurationsoptionen von Drogon. Custom_config ändert die Eigenschaft von TLGs selbst. Aktuelle unterstützte Optionen sind:
Der Ranking -Algorithmus TLGS verwendet die Seiten im Suchergebnis. Das Ranking wird dann mit dem Text Match Score kombiniert, um den endgültigen Suchrang zu erstellen. Aktuelle unterstützte Werte sind hits und salsa . Bezieht sich auf den Hits und den Salsa -Ranking -Algorithmus. Es ist standardmäßig salsa , wenn kein Wert bereitgestellt wird.
Salsa läuft etwas schneller als Hits für große Suchergebnisse. Sowohl Literatur als auch imperische Erfahrung legen nahe, dass Salsa eine bessere Rangfolge bietet. So wechselten wir von Hits zu Salsa.
"ranking_algo" : " salsa "