Search Engines Scraper
1.0.0
Google, Bing, Yahoo 및 기타 검색 엔진을 쿼리하고 여러 검색 엔진 결과 페이지에서 결과를 수집하는 Python 라이브러리.
웹 스크래핑은 일부 검색 엔진의 TOS에 위배 될 수 있으며 일시적인 금지가 발생할 수 있습니다.
Google
빙
야후
Duckduckgo
시작 페이지
AOL
Dogpile
묻다
모조크
용감한
토치
search_engines/engines/ 에서 새 클래스를 생성하여 새 엔진을 추가하고 search_engines/engines/__init__.py 의 search_engines_dict Dictionary에 추가 할 수 있습니다. 새 클래스는 SearchEngine 서브 클래스하고 다음 방법을 무시해야합니다. _selectors , _first_page , _next_page . Python 2.7-3.x
요청 및
BeautifulSoup
설정 파일 : $ python setup.py install 실행하십시오.
완료!
도서관 :
from search_engines import Google
engine = Google()
results = engine.search("my query")
links = results.links()
print(links)
CLI 스크립트로 :
$ python search_engines_cli.py -e google,bing -q "my query" -o json,print