使用技術golang+goleveldb
內建小白數據庫系統(考據級全文索引數據庫系統),內置“全文索引”,無需分詞庫,卻永遠沒有搜索不到的詞。
ReSearch,從原“乾隆大藏經搜索引擎”和“四庫全書搜索引擎”逐漸完善改進而成。
可用於整理大量的資料並且具備考據級別的搜索功能的系統。
也可僅作搜索中介用,如:站內搜索;企業搜索引擎等等。
自主研發的遍歷分詞技術,搜索引擎突破性技術,無需分詞庫,搜索成功率是100%。
分詞庫是搜索引擎的核心。分詞庫就是搜索引擎的眼睛。沒有眼睛什麼都看不見,什麼都搜索不到。
然而分詞庫基本上都難以完善,也不可能做到完整的。所以必定存在有些詞搜索不到結果。
特別是新詞,新詞第一時間是不可能搜索得到的,因為分詞庫裡沒有。
新詞搜索不到,就等於扼殺了創新的動力,特別是在電商領域裡。
即使分詞庫管理第一時間將新詞加入庫,但是要搜索到,就必須要經歷將所有大量的原數據遍歷處理才能得出結果。
數據量越大的系統,加入新詞就越謹慎,時間就越慢。
ReSearch,則摒棄分詞庫。
如果分詞庫是其他搜索引擎的眼睛,這個眼睛是肉眼。而遍歷分詞的眼睛則是天眼。
其他分詞技術會因為分詞庫的不完善,會導致搜索不到結果的概率。也就是做不到搜索成功率是100%。
舉個極端的例子:
將一篇文章全部倒過來,然後也用倒過來的詞搜索。
其他分詞技術估計什麼都搜索不到。
遍歷分詞技術,無論如何,搜索成功率都是100%。
可以自定義搜索粒度。
通用的搜索引擎如Google,百度,搜索粒度是整篇文章。
ReSearch,可以自定義到段落,句子等等。
通常定義精準粒度為句子。
百億級數據,毫秒級響應。
因為無需分詞庫,不需要解析分詞,比其他分詞技術的搜索引擎性能更高。
實時添加實時搜索。
10G級別的文本數據,只需幾十M內存。
打開對應系統的可執行文件即可運作。