scrapy
1.0.0
일부 크롤러는 스크레이프 프레임 워크를 사용하여 Liaoning University of Engineering and Technology의 뉴스 네트워크를 기어 다닙니다. 스크레이프 프레임 워크의 주요 부분에 대한 설명 :
검색 엔진의 전반적인 아이디어 : 분사 데이터베이스에 저장된 타이틀과 키워드 색인을 설정합니다. 둘째, 키워드의 빈도에 따라 키워드 및 발생의 색인 테이블이 설정됩니다. 주요 문서 설명 :
forwardIndexTableItem 정의하고, 테이블의 배열 내용을 지정하고, 앞쪽 테이블 클래스 forwardIndexTable 에서 제목 분사가 데이터베이스 테이블에 수행되고 저장됩니다.메모 및 단점 :
scrapy crawl Intu 로 입력하십시오.