Saat ini, untuk mempertimbangkan beban backend, backend mesin pencari telah diubah menjadi flask
Namun, struktur penyimpanan sementara CubeQL menggunakan Fastapi
Situs web resmi: http://115.29.198.35 Email Penulis: [email protected]


Struktur penyimpanan sementara untuk pencarian blush, menerapkan fungsi seperti redis, dan juga dapat menyaring URL crawler melalui modul filter mekar, dan menggunakannya sebagai deduplikasi
Optimalisasi Kecepatan Diharapkan Menggunakan Vlang
Optimalkan masalah 404 masih dimasukkan dalam crawling kode status dengan crawler terdistribusi, yang meningkatkan hasil pencarian hasil web dan peningkatan berat (pengalihan)
Mozilla/5.0 (kompatibel; verdantspider/1.0)
Tambahkan beberapa fungsi pembaruan dinamis berat mesin pencari yang diperlukan (selesai)
Menerapkan pencarian fuzzy dari Cina-> pinyin (perlu membuat tabel pemetaan baru)
Menerapkan penyimpanan basis data terpisah
Konversi ke PostgreSQL (selesai)
Statistik Rincian setiap pencarian untuk ringkasan yang mudah (selesai)
Tambahkan kunci terdistribusi yang diimplementasikan oleh CubeQL
Menerapkan kata pencarian untuk disimpan di cloud, dan server tidak memerlukan beberapa perayapan
Laksanakan audio setelah mengklik ikon volume
Menerapkan vlang, bukan sebagian besar fungsi Python dan mengoptimalkan kinerja
Sadari hot spot harian
Menerapkan ringkasan cerdas dari berbagai mesin pencari
Gunakan wadah untuk mengelola lingkungan untuk mewujudkan penyebaran satu klik dan operasi satu klik
Siklus hidup untuk setiap indeks tunggal pencarian, dan beratnya akan dikurangi setelah beberapa saat (program baru diperlukan untuk mempertahankan) (selesai)
Menerapkan Simhash dan mengimplementasikan deduplikasi situs web blog seperti CSDN
Mendukung Pencarian Diversifikasi dan Filter yang lebih ramah pengguna
Versi referensi PostgreSQL adalah 11.10
Python> = 3.6
labu
FASTAPI == 0.54.1
psycopg2
Starlette
requests_html
Jieba
Demjson
Bloomfilter_live
gevent
├─.vscode
├─Docs
├─ Sumber daya
│ ├─config
│ ├─Cubeql
│ └─__pycache__
│ ├─Lib
│ ├─Spider
│ └─__pycache __ │ ├─Static
│ │ ├─CSS
│ │ ├─Img
│ └─Music
│ ├─ Templat
│ └─__pycache __
└─sql
Dokumen: secara teratur menyimpan dokumen
Sumber Daya: Direktori Penyimpanan Kode Sumber
Config: Direktori alternatif untuk file konfigurasi JSON (benar -benar dipanggil di direktori root, dan optimalisasi struktur direktori belum selesai
CubeQL: Direktori yang menyimpan kode sumber terkait CubeQL
Laba -laba: Direktori untuk menyimpan crawler
Lib: Persyaratan toko
Statis: Simpan file statis
Template: Simpan file template
SQL: Store Alternate Table Creation File SQL
backend.py - file backend mesin pencari
config.json - file konfigurasi, hanya file json di direktori root tempat kode sedang berjalan berlaku
Mungkin ada beberapa perpustakaan di lingkungan yang tidak disebutkan, tapi bagaimanapun, apa yang harus diinstal
Ubah Kata Sandi Akun Database dan IP Config.json
Pastikan PostgreSQL terbuka
Jalankan di direktori cubeql
Uvicorn Cubeql: App --port 1278
Dijalankan di direktori sumber daya
python backend.py
Jalankan di direktori laba -laba (Anda dapat membuka pencarian hijau jika Anda tidak menjalankannya)
Python CDS-Distributed.py
Dengan mengakses /tren, Anda dapat menghitung frekuensi pencarian semua kata kunci
Menulis sistem plug-in cukup sederhana.
Kemudian buat index.html dan package.json baru di folder Extensions.
package.json