Un outil qui peut trouver votre document à l'aide de la recherche sémantique .
Ceci est une version improvisée de l'alimentation intelligente
Liste des nouvelles fonctionnalités -
À quel point le trouvez-vous facile de vous souvenir de l'emplacement exact d'un document que vous avez créé l'année dernière? Pas très facile, non? Les grandes organisations / personnes traitent des centaines de documents par jour et les oublient, la plupart du temps.
Mais que se passe-t-il si nous voulons à nouveau cette ancienne documentation pour un peu de travail, mais malheureusement, vous ne vous souvenez pas du nom ou du contenu réel de ce document pour le récupérer à partir du grand stockage de votre ordinateur.
Dans de tels cas, l'utilisation d'un chercheur de documents intelligent peut vraiment faire une énorme différence. Comme, il peut rechercher le document ( semantically ) de vos besoins en fonction d'une entrée de requête. Cela contribuera non seulement à un accès plus rapide au document, mais aidera également à regrouper des documents similaires et à les analyser.
Regarder la démo du projet:
Actuellement, cette référentiel utilise une base de données prédéfinie des articles de presse recueillis par tracotage Web. En raison des restrictions GitHub sur le téléchargement des fichiers volumineux, nous ne pouvons pas le télécharger ici.
Bientôt, nous ajouterons la prise en charge des bases de données dynamiques, afin que vous puissiez utiliser cet outil pour vos propres bases de données afin de créer votre propre moteur de recherche personnalisé.
Python3.6 JavaScript jQuery HTML & CSS

> mkdir IntelligentDocumentFinder
> cd IntelligentDocumentFinder
> git clone https://github.com/Sarthakjain1206/Intelligent_Document_Finder_2.0.git
Installer un environnement vital s'il n'est pas installé
> python3 -m pip install --user virtualenv> py -m pip install --user virtualenvCréer un environnement virtuel
> python3 -m venv env> py -m venv envActiver l'environnement:
> source env/bin/activate> .envScriptsactivate > pip install -r requirements.txt
Téléchargez Glove Word Embeddings à partir de ce lien, décompressez-le et copiez le fichier glove.6B.100d dans le dossier DataBase
Ensuite, exécutez initial_file.py via cette commande > python initial_file.py
Maintenant, vous êtes prêt à partir. Tapez simplement cette commande à chaque fois que vous souhaitez y accéder et ouvrez le site Web dans Chrome / Firefox
> python src/app.py
Vous pouvez nous contacter sur les profils liés
Sarthak Jain Machine Learning NLP Web Crawling
Vous pouvez également me suivre sur GitHub pour rester à jour sur mes derniers projets
Rishabh Mishra Full Stack Web Developer
Vous pouvez également me suivre sur GitHub pour rester à jour sur mes derniers projets
Si vous avez aimé ce référentiel, alors soutenez-le en lui donnant une étoile
Il existe de nombreuses fonctionnalités qui peuvent être ajoutées à cet outil.
Si vous avez une expérience dans la mise en œuvre de l'une de ces fonctionnalités, contribuez .
Awsome Article d'algorithme de classement BM25 sur Wikipedia - Okapi BM25
Lisez cet article sur la modélisation des sujets
A complètement suivi ce bel article sur le marquage des SVOS pour générer des balises pour ce projet.
Utilisé l'implémentation de fichiers de classement BM25 à partir de cette grande référentiel sur GitHub par dorianbrown .