Moteur de recherche de nouvelles

Comment utiliser
- Installez l'environnement Python 3.4+ (ANACONDA ou MINICONDA recommandée)
- Installez l'analyseur LXML HTML, la commande est
pip install lxml - Installez le composant de participe Jieba Word, la commande est
pip install jieba - Installer Flask Web Framework, la commande est
pip install Flask - Entrez le dossier Web et exécutez le fichier main.py
- Ouvrez le navigateur et visitez http://127.0.0.1:5000/ Entrez les mots clés pour commencer les tests
Si vous souhaitez saisir les dernières données d'actualités et créer un index, exécutez ./code/setup.py en un clic, puis testez-les conformément à la méthode ci-dessus.
2020.4.5: Ajout d'un programme Crawler pour capturer China News Network. Exécutez d'abord ./code/spider.chinanews.com.py pour ramper les nouvelles au cours des 5 derniers jours (environ 2500); puis commentez ./code/setup.py Line 38 et exécutez-le pour créer automatiquement l'index.
Introduction du projet
- Construire un moteur de recherche avec moi (i) Introduction
- Construisez un moteur de recherche avec moi (ii) robot Web Web
- Construire un moteur de recherche avec moi (iii) construire un index
- Travaillez avec moi pour construire un modèle de recherche de moteur de recherche (IV)
- Construire un moteur de recherche avec moi (cinq) lecture recommandée
- Construisez un moteur de recherche avec moi (VI) Affichage du système
- Construire un moteur de recherche avec moi (7) Résumé des perspectives
- Construisez un moteur de recherche avec moi (huit) Mettez à jour le robot et modifiez le déploiement de notation et en ligne
reconnaissant
- jieba
- scikit-apprend
- ballon