TLGS는 Gemini의 검색 엔진입니다. 그것은 현재의 것이 무엇인지에 대해 약간 과도하게 참여하고 이상한 기술을 사용합니다. 그리고 나는 그것을 자랑스럽게 생각합니다. 현재 코드 Basse는 좀 더 지저분합니다. 청소하겠다고 약속합니다. 주요 기능/특성은 다음과 같습니다.
현재 뉴스 사이트, RFC, 문서의 색인은 대부분 비활성화됩니다. 그러나 설정을 확장 할 수있는 평균과 리소스가 있으면 활성화 될 수 있습니다.
프로젝트를 구축합니다. 완전히 C ++ 20 기능 컴파일러가 필요합니다. 다음 컴파일러는이 readme을 작성할 때 작동해야합니다.
모든 종속성을 설치하십시오. 명령을 실행합니다.
mkdir build
cd build
cmake ..
make -jInital Index를 생성하려면 :
./tlgs/tlgs_ctl/tlgs_ctl ../tlgs/config.json populate_schemaseeds.text 에 넣습니다./tlgs/crawler/tlgs_crawler -s seeds.text -c 4 ../tlgs/config.json 실행하십시오.이제 크롤러는 Geminispace를 크롤링하면서 구식 인덱스 (있는 경우)를 업데이트하기 시작합니다. 기존 인덱스를 업데이트합니다. 달리다:
./tlgs/crawler/tlgs_crawler -c 2 ../tlgs/config.json
# -c is the maximum concurrent connections the crawler will make참고 : TLGS의 크롤러는 배포 가능합니다. 여러 인스턴스를 병렬로 실행할 수 있습니다. 그러나 일부 사람들은 끝이나 크롤링을 향해 일찍 떨어질 수 있습니다. 크롤링의 결과에 영향을 미치지는 않지만.
openssl req -new -subj " /CN=my.host.name.space " -x509 -newkey ec -pkeyopt ec_paramgen_curve:prime256v1 -days 36500 -nodes -out cert.pem -keyout key.pem
cd tlgs/server
./tlgs_server ../../../tlgs/server_config.jsonsudo systemctl start tlgs_server
sudo systemctl start tlgs_crawler search_config.json 의 custom_config.tlgs 섹션 ( /etc/tlgs/server_config.json 에 설치)에는 tlgs 서버에 대한 confgurations가 포함되어 있습니다. 일반적인 Drogon의 구성 옵션 외에. Custom_Config는 TLGS 자체의 속성을 변경합니다. 현재 지원되는 옵션은 다음과 같습니다.
순위 알고리즘 TLGS는 검색 결과에서 페이지 순위를 매기는 데 사용합니다. 그런 다음 순위는 텍스트 매치 점수와 결합되어 최종 검색 순위를 생성합니다. 현재 지원되는 값은 hits and salsa 입니다. 히트와 살사 순위 알고리즘을 참조하십시오. 값이 제공되지 않으면 salsa 의 기본값이 기본적으로 표시됩니다.
살사는 큰 검색 결과를 위해 히트보다 약간 빠릅니다. 문학과 필수 경험은 Salsa가 더 나은 순위를 제공한다고 제안합니다. 따라서 우리는 히트에서 살사로 전환했습니다.
"ranking_algo" : " salsa "