TLGSはジェミニの検索エンジンです。それは現在のものでわずかに専用であり、奇妙な技術を使用しています。そして、私はそれを誇りに思っています。現在のコードバスはちょっと面倒です - 私はそれらをきれいにすることを約束します。主な機能/特性は次のとおりです。
現在のところ、ニュースサイト、RFC、ドキュメントのインデックス作成はほとんど無効です。ただし、セットアップを拡大する平均とリソースが得られたら、おそらく有効になります。
プロジェクトを構築します。完全にC ++ 20の有能なコンパイラが必要です。次のコンパイラは、このreadmeを書いている時点で動作するはずです
すべての依存関係をインストールします。コマンドを実行します:
mkdir build
cd build
cmake ..
make -jInital Indexを作成するには:
./tlgs/tlgs_ctl/tlgs_ctl ../tlgs/config.json populate_schemaseeds.textに配置します./tlgs/crawler/tlgs_crawler -s seeds.text -c 4 ../tlgs/config.jsonこれで、クローラーはジェミニスペースをrawったが、時代遅れのインデックス(ある場合)も更新し始めます。既存のインデックスを更新します。走る:
./tlgs/crawler/tlgs_crawler -c 2 ../tlgs/config.json
# -c is the maximum concurrent connections the crawler will make注: TLGSのクローラーは配布可能です。複数のインスタンスを並行して実行できます。しかし、いくつかのイントランスは、最後に向かって早く脱落したり、rawいたりすることもあります。クロールの結果には影響しませんが。
openssl req -new -subj " /CN=my.host.name.space " -x509 -newkey ec -pkeyopt ec_paramgen_curve:prime256v1 -days 36500 -nodes -out cert.pem -keyout key.pem
cd tlgs/server
./tlgs_server ../../../tlgs/server_config.jsonsudo systemctl start tlgs_server
sudo systemctl start tlgs_crawlersearch_config.jsonのcustom_config.tlgsセクション( /etc/tlgs/server_config.jsonにインストール)には、TLGSサーバーの争いが含まれています。通常のドロゴンの設定オプションに加えて。 custom_configは、TLGS自体のプロパティを変更します。現在のサポートされているオプションは次のとおりです。
ランキングアルゴリズムTLGSは、検索結果にページをランク付けするために使用します。次に、ランキングをテキストマッチスコアと組み合わせて、最終検索ランクを作成します。現在のサポートされている値はhitsとsalsaです。ヒットとサルサのランキングアルゴリズムを参照してください。値が提供されていない場合、デフォルトはsalsaになります。
Salsaは、大規模な検索結果のヒットよりもわずかに速く実行されます。文学と命令の両方の経験は、サルサがより良いランキングを提供することを示唆しています。したがって、ヒットからサルサに切り替えました。
"ranking_algo" : " salsa "