Gunakan Teknologi Golang+Goleveldb
Sistem basis data Xiaobai bawaan (sistem basis data indeks teks lengkap level teks), "indeks teks lengkap" bawaan, tidak perlu segmentasi kamus, tetapi tidak pernah ada kata-kata yang tidak dapat dicari.
Penelitian telah secara bertahap ditingkatkan dan ditingkatkan dari "mesin pencari Qianlong Tripitaka" asli dan "mesin pencari Siku Quanshu".
Ini dapat digunakan untuk mengatur sejumlah besar informasi dan memiliki fungsi pencarian di tingkat tingkat teks.
Ini juga dapat digunakan sebagai perantara pencarian, seperti: pencarian situs;
Teknologi segmentasi kata traversal yang dikembangkan secara independen, teknologi terobosan untuk mesin pencari, tidak memerlukan segmentasi kosa kata, dan tingkat keberhasilan pencarian adalah 100%.
Thesaurus adalah inti dari mesin pencari. Kata segmentasi adalah mata mesin pencari. Tanpa mata, Anda tidak dapat melihat apa pun dan mencari apa pun.
Namun, database kosa kata pada dasarnya sulit untuk disempurnakan, dan tidak mungkin untuk mencapai kelengkapan. Karena itu, harus ada beberapa kata yang tidak dapat dicari.
Khusus untuk kata -kata baru, tidak mungkin untuk mencari kata -kata baru pada pertama kalinya karena tidak ada di perpustakaan kosa kata.
Jika kata-kata baru tidak dapat dicari, itu setara dengan membunuh kekuatan pendorong untuk inovasi, terutama di bidang e-commerce.
Bahkan jika manajemen Segmentasi Kata menambahkan kata -kata baru ke perpustakaan sesegera mungkin, untuk mencari, perlu melalui traversal dari semua data asli untuk mendapatkan hasilnya.
Semakin besar volume data sistem, semakin hati -hati menambahkan kata -kata baru dan semakin lambat waktu.
Penelitian, meninggalkan kamus.
Jika Pustaka Segmentasi Kata adalah mata mesin pencari lainnya, mata ini adalah mata telanjang. Mata yang melintasi participle adalah mata surgawi.
Teknik Segmentasi Kata lainnya akan mengarah pada probabilitas tidak dapat mencari hasil karena ketidaklengkapan database Segmentasi Kata. Dengan kata lain, tingkat keberhasilan pencarian adalah 100%.
Untuk memberikan contoh ekstrem:
Balikkan semua artikel dan cari dengan kata -kata terbalik juga.
Teknik kata participle lainnya mungkin tidak dapat mencari apa pun.
Tingkat keberhasilan pencarian adalah 100% dalam teknologi segmentasi kata traversal.
Anda dapat menyesuaikan granularitas pencarian.
Mesin pencari umum seperti Google dan Baidu, granularitas pencarian adalah seluruh artikel.
Penelitian, Anda dapat menyesuaikan dengan paragraf, kalimat, dll.
Biasanya, granularitas yang tepat didefinisikan sebagai kalimat.
Puluhan miliar data, respons milidetik.
Karena tidak perlu segmentasi kata dan tidak perlu mem -parse segmentasi kata, ia memiliki kinerja yang lebih tinggi daripada mesin pencari dengan teknologi segmentasi kata lainnya.
Tambahkan pencarian waktu nyata secara real time.
Data teks tingkat 10G hanya membutuhkan lusinan M memori.
Buka file yang dapat dieksekusi dari sistem yang sesuai dan kemudian jalankan.