TLGS adalah mesin pencari untuk Gemini. Ini sedikit terlalu direkayasa untuk apa adanya dan menggunakan teknologi aneh. Dan saya bangga akan hal itu. Kode Basse saat ini agak berantakan - saya berjanji untuk membersihkannya. Fitur/karakteristik utama adalah sebagai berikut:
Sampai sekarang, pengindeksan situs berita, RFC, dokumentasi sebagian besar dinonaktifkan. Tetapi kemungkinan diaktifkan setelah saya memiliki rata -rata dan sumber daya untuk skala pengaturan.
Untuk membangun proyek. Anda akan membutuhkan kompiler yang mampu C ++ 20 sepenuhnya. Kompiler berikut harus berfungsi saat menulis readme ini
Instal semua dependensi. Dan jalankan perintah:
mkdir build
cd build
cmake ..
make -jUntuk membuat indeks inital:
./tlgs/tlgs_ctl/tlgs_ctl ../tlgs/config.json populate_schemaseeds.text./tlgs/crawler/tlgs_crawler -s seeds.text -c 4 ../tlgs/config.jsonSekarang crawler akan mulai merangkak GeminiSpace sambil juga memperbarui indeks yang sudah ketinggalan zaman (jika ada). Untuk memperbarui indeks yang ada. Berlari:
./tlgs/crawler/tlgs_crawler -c 2 ../tlgs/config.json
# -c is the maximum concurrent connections the crawler will makeCatatan: Perayap TLGS dapat didistribusikan. Anda dapat menjalankan beberapa contoh secara paralel. Tetapi beberapa maksud mungkin keluar lebih awal menjelang akhir atau merangkak. Meskipun itu tidak mempengaruhi hasil merangkak.
openssl req -new -subj " /CN=my.host.name.space " -x509 -newkey ec -pkeyopt ec_paramgen_curve:prime256v1 -days 36500 -nodes -out cert.pem -keyout key.pem
cd tlgs/server
./tlgs_server ../../../tlgs/server_config.jsonsudo systemctl start tlgs_server
sudo systemctl start tlgs_crawler Bagian custom_config.tlgs di search_config.json (diinstal di /etc/tlgs/server_config.json ) berisi confgurations untuk server TLGS. Selain opsi konfigurasi Drogon yang biasa. custom_config mengubah properti TLGS itu sendiri. Opsi yang didukung saat ini adalah:
Algoritma peringkat yang digunakan TLGS untuk memberi peringkat halaman dalam hasil pencarian. Peringkat kemudian dikombinasikan dengan skor pertandingan teks untuk menghasilkan peringkat pencarian akhir. Nilai yang didukung saat ini adalah hits dan salsa . Mengacu pada algoritma peringkat hit dan salsa. Itu default ke salsa jika tidak ada nilai yang disediakan.
Salsa berjalan sedikit lebih cepat daripada hit untuk hasil pencarian yang besar. Baik literatur dan pengalaman imperikal menyarankan Salsa memberikan peringkat yang lebih baik. Jadi kami beralih dari hit ke salsa.
"ranking_algo" : " salsa "