Search Engines Scraper
1.0.0
Une bibliothèque Python qui interroge Google, Bing, Yahoo et d'autres moteurs de recherche et collecte les résultats à partir de plusieurs pages de résultats de moteurs de recherche.
Veuillez noter que le scapage du Web peut être contraire aux TO de certains moteurs de recherche et peut entraîner une interdiction temporaire.
Google
Bing
Yahoo
Duckduckgo
Page de démarrage
Aol
Pile de chien
Demander
Mojeek
Courageux
Torche
search_engines/engines/ et l'ajouter au dictionnaire search_engines_dict dans search_engines/engines/__init__.py . La nouvelle classe doit sous-classer SearchEngine et remplacer les méthodes suivantes: _selectors , _first_page , _next_page . Python 2.7 - 3.x avec
Demandes et
BelSoup
Exécutez le fichier de configuration: $ python setup.py install .
Fait!
En tant que bibliothèque:
from search_engines import Google
engine = Google()
results = engine.search("my query")
links = results.links()
print(links)
En tant que script CLI:
$ python search_engines_cli.py -e google,bing -q "my query" -o json,print