tlgs
1.0.0
TLGS是双子座的搜索引擎。它对当前的现状和使用怪异的技术有些过度设计。我为此感到自豪。当前的代码basse有点混乱 - 我保证将清理它们。主要特征/特征如下:
截至目前,新闻网站,RFC,文档的索引大多是禁用的。但是,一旦我拥有扩展设置的平均值和资源,就可以启用。
建立项目。您需要一个完全C ++ 20的编译器。以下编译器应在撰写此读数时工作
安装所有依赖关系。并运行命令:
mkdir build
cd build
cmake ..
make -j创建Inital索引:
./tlgs/tlgs_ctl/tlgs_ctl ../tlgs/config.json populate_schemaseeds.text中。./tlgs/crawler/tlgs_crawler -s seeds.text -c 4 ../tlgs/config.json现在,爬网将开始爬行双子座,同时还更新过时的索引(如果有)。更新现有索引。跑步:
./tlgs/crawler/tlgs_crawler -c 2 ../tlgs/config.json
# -c is the maximum concurrent connections the crawler will make注意: TLGS的爬行者是可以分发的。您可以并行运行多个实例。但是,某些目的可能在结束或爬行。尽管它不影响爬行的结果。
openssl req -new -subj " /CN=my.host.name.space " -x509 -newkey ec -pkeyopt ec_paramgen_curve:prime256v1 -days 36500 -nodes -out cert.pem -keyout key.pem
cd tlgs/server
./tlgs_server ../../../tlgs/server_config.jsonsudo systemctl start tlgs_server
sudo systemctl start tlgs_crawlersearch_config.json中的custom_config.tlgs部分(安装在/etc/tlgs/server_config.json )中包含TLGS服务器的浓汤。除了通常的Drogon的配置选项。 custom_config更改了TLGS本身的属性。当前支持的选项是:
排名算法TLGS在搜索结果中使用排名页面。然后将排名与文本匹配分数结合使用,以产生最终的搜索级别。当前支持的值是hits和salsa 。指命中和莎莎排名算法。如果没有提供值,它将默认为salsa 。
Salsa的运行速度略高于较大的搜索结果。文学和不可或缺的经验都表明莎莎提供了更好的排名。因此,我们从命中切换到莎莎酱。
"ranking_algo" : " salsa "