tlgs
1.0.0
TLGS是雙子座的搜索引擎。它對當前的現狀和使用怪異的技術有些過度設計。我為此感到自豪。當前的代碼basse有點混亂 - 我保證將清理它們。主要特徵/特徵如下:
截至目前,新聞網站,RFC,文檔的索引大多是禁用的。但是,一旦我擁有擴展設置的平均值和資源,就可以啟用。
建立項目。您需要一個完全C ++ 20的編譯器。以下編譯器應在撰寫此讀數時工作
安裝所有依賴關係。並運行命令:
mkdir build
cd build
cmake ..
make -j創建Inital索引:
./tlgs/tlgs_ctl/tlgs_ctl ../tlgs/config.json populate_schema populate_schemaseeds.text中。./tlgs/crawler/tlgs_crawler -s seeds.text -c 4 ../tlgs/config.json現在,爬網將開始爬行雙子座,同時還更新過時的索引(如果有)。更新現有索引。跑步:
./tlgs/crawler/tlgs_crawler -c 2 ../tlgs/config.json
# -c is the maximum concurrent connections the crawler will make注意: TLGS的爬行者是可以分發的。您可以並行運行多個實例。但是,某些目的可能在結束或爬行。儘管它不影響爬行的結果。
openssl req -new -subj " /CN=my.host.name.space " -x509 -newkey ec -pkeyopt ec_paramgen_curve:prime256v1 -days 36500 -nodes -out cert.pem -keyout key.pem
cd tlgs/server
./tlgs_server ../../../tlgs/server_config.jsonsudo systemctl start tlgs_server
sudo systemctl start tlgs_crawlersearch_config.json中的custom_config.tlgs部分(安裝在/etc/tlgs/server_config.json )中包含TLGS服務器的濃湯。除了通常的Drogon的配置選項。 custom_config更改了TLGS本身的屬性。當前支持的選項是:
排名算法TLGS在搜索結果中使用排名頁面。然後將排名與文本匹配分數結合使用,以產生最終的搜索級別。當前支持的值是hits和salsa 。指命中和莎莎排名算法。如果沒有提供值,它將默認為salsa 。
Salsa的運行速度略高於較大的搜索結果。文學和不可或缺的經驗都表明莎莎提供了更好的排名。因此,我們從命中切換到莎莎醬。
"ranking_algo" : " salsa "