FunpySpiderSearchEngine
1.0.0
Word2Vec 개인 검색 구현 + Scrapy2.3.0 (크롤링 데이터) + Elasticsearch7.9.1 (데이터 저장 및 외부 편안한 API 제공) + Django3.1.1 검색
이 창고는 Crawler 데이터 스토리지의 Elasticsearch 코드입니다 .
Word2Vec 모델 교육의 전체 프로세스에 대해서는 Word2VecModel에서 readme Word2Vec의 사용을 확인하십시오.
핵심 점수 코드 :
"source": "double final_score=_score;int count=0;int total = params.title_keyword.size();while(count < total) { String upper_score_title = params.title_keyword[count]; if(doc['title_keyword'].value.contains(upper_score_title)){final_score = final_score+_score;}count++;}return final_score;"
각 타이틀에 대해 점수가 두 배가됩니다.
git clone https://github.com/mtianyan/FunpySpiderSearchEngine
# 修改config_template中配置信息后重命名为config.py
# 执行 sites/zhihu/es_zhihu.py
cd FunpySpiderSearchEngine
pip install -r requirements.txt
scrapy crawl zhihu
docker network create search-spider
git clone https://github.com/mtianyan/mtianyanSearch.git
cd mtianyanSearch
docker-compose up -d
git clone https://github.com/mtianyan/FunpySpiderSearchEngine
cd FunpySpiderSearchEngine
docker-compose up -d
127.0.0.1:8080을 방문하십시오
내 프로젝트 코드가 도움이되면 매운 스트립 빵을주세요!