Widescale é um mecanismo de indexação e pesquisa de texto completo, escrito em Golang. A escala de água é exclusivamente para fins educacionais. Ele fornece uma API simples para procurar palavras ou grupo de palavras, dentro de uma grande quantidade de texto espalhado por vários documentos. Internamente, a widescale usa um índice invertido, semelhante ao Elasticsearch. Para mais informações, consulte este artigo.
Deixe -me saber se vocês têm alguma sugestão.
Encontrei índice invertido enquanto estava lendo sobre elasticsearch. Para entender por que usá -lo, aqui está o trecho do artigo da Wikipedia sobre ele -
Ao lidar com um pequeno número de documentos, é possível que o mecanismo de busca de texto completo digitalize diretamente o conteúdo dos documentos a cada consulta, uma estratégia chamada "varredura serial". É isso que algumas ferramentas, como Grep, fazem ao pesquisar.
No entanto, quando o número de documentos a serem pesquisados é potencialmente grande, ou a quantidade de consultas de pesquisa para executar é substancial, o problema da pesquisa de texto completo é frequentemente dividido em duas tarefas: indexação e pesquisa. O estágio de indexação examinará o texto de todos os documentos e criará uma lista de termos de pesquisa (geralmente chamados de índice). Na fase de pesquisa, ao executar uma consulta específica, apenas o índice é referenciado, em vez do texto dos documentos originais.
Eu realmente não achei que poderia fazer uma explicação melhor do que isso.
go à sua variável de ambiente de caminho. > go get github.com/gorilla/mux
> go get github.com/anubhavp28/WideScale/
> go install github.com/anubhavp28/WideScale/
Para iniciar o servidor, basta executar:
> cd $(go env GOPATH)/bin
> widescale <path-to-dir-containing-txt-files-to-index>
Este projeto está licenciado sob a licença do MIT - consulte o arquivo License.md para obter detalhes.