Widescale est un moteur d'indexation et de recherche en texte intégral, écrit en Golang. Widecale est uniquement à des fins éducatives. Il fournit une API simple pour rechercher des mots ou un groupe de mots, à l'intérieur d'une grande quantité de texte réparti sur plusieurs documents. En interne, Widescale utilise un indice inversé, similaire à Elasticsearch. Pour plus d'informations, consultez cet article.
Faites-moi savoir si vous avez des suggestions.
J'ai trouvé un index inversé pendant que je lisais sur Elasticsearch. Pour comprendre pourquoi l'utiliser, voici l'extrait de l'article de Wikipedia à ce sujet -
Lorsque vous traitez avec un petit nombre de documents, il est possible que le moteur de recherche de texte complet scanne directement le contenu des documents avec chaque requête, une stratégie appelée "numérisation série". C'est ce que font certains outils, comme Grep, lors de la recherche.
Cependant, lorsque le nombre de documents à rechercher est potentiellement important ou que la quantité de requêtes de recherche à effectuer est substantielle, le problème de la recherche en texte intégral est souvent divisé en deux tâches: l'indexation et la recherche. L'étape d'indexation analysera le texte de tous les documents et créera une liste de termes de recherche (souvent appelés index). Au stade de recherche, lors de l'exécution d'une requête spécifique, seul l'index est référencé, plutôt que le texte des documents originaux.
Je ne pensais vraiment pas que je pouvais faire une meilleure explication que cela.
go vers votre variable d'environnement de chemin. > go get github.com/gorilla/mux
> go get github.com/anubhavp28/WideScale/
> go install github.com/anubhavp28/WideScale/
Pour démarrer le serveur, exécutez simplement:
> cd $(go env GOPATH)/bin
> widescale <path-to-dir-containing-txt-files-to-index>
Ce projet est autorisé en vertu de la licence MIT - voir le fichier Licence.md pour plus de détails.