WideScale
1.0.0
宽度是用Golang编写的全文索引和搜索引擎。广泛仅用于教育目的。它提供了一个简单的API来搜索单词或一组单词,内部分布在多个文档中。在内部,宽度使用倒置索引,类似于Elasticsearch。有关更多信息,请参见本文。
让我知道你们是否有建议。
我在阅读有关Elasticsearch时发现了倒置索引。要了解为什么使用它,这是Wikipedia文章的摘录 -
在处理少量文档时,全文搜索引擎有可能在每个查询中直接扫描文档的内容,这是一种称为“串行扫描”的策略。这就是搜索时某些工具(例如GREP)要做的。
但是,当搜索的文档数量可能很大,或者要执行的搜索查询数量是实质的,则全文搜索的问题通常分为两个任务:索引和搜索。索引阶段将扫描所有文档的文本,并构建搜索术语列表(通常称为索引)。在搜索阶段,在执行特定查询时,仅引用索引,而不是原始文档的文本。
我真的认为我不能做出更好的解释。
go安装路径添加到路径环境变量。 > go get github.com/gorilla/mux
> go get github.com/anubhavp28/WideScale/
> go install github.com/anubhavp28/WideScale/
要启动服务器,只需运行:
> cd $(go env GOPATH)/bin
> widescale <path-to-dir-containing-txt-files-to-index>
此项目已获得MIT许可证的许可 - 有关详细信息,请参见许可证文件。