FunpySpiderSearchEngine
1.0.0
การใช้งานการค้นหาส่วนบุคคลของ Word2vec + Scrapy2.3.0 (ข้อมูลรวบรวมข้อมูล) + Elasticsearch7.9.1 (จัดเก็บข้อมูลและจัดหา API ที่เหลือภายนอก) + Django3.1.1 การค้นหา
คลังสินค้านี้เป็นรหัส Elasticsearch สำหรับการจัดเก็บข้อมูลตัวรวบรวมข้อมูล
สำหรับกระบวนการทั้งหมดของการฝึกอบรมแบบจำลอง Word2vec โปรดตรวจสอบการใช้ Readme Word2vec ใน Word2vecModel ซึ่งส่งผลต่อการให้คะแนนของ Elasticsearch
รหัสการให้คะแนนหลัก:
"source": "double final_score=_score;int count=0;int total = params.title_keyword.size();while(count < total) { String upper_score_title = params.title_keyword[count]; if(doc['title_keyword'].value.contains(upper_score_title)){final_score = final_score+_score;}count++;}return final_score;"
คะแนนเพิ่มขึ้นเป็นสองเท่าสำหรับแต่ละชื่อ
git clone https://github.com/mtianyan/FunpySpiderSearchEngine
# 修改config_template中配置信息后重命名为config.py
# 执行 sites/zhihu/es_zhihu.py
cd FunpySpiderSearchEngine
pip install -r requirements.txt
scrapy crawl zhihu
docker network create search-spider
git clone https://github.com/mtianyan/mtianyanSearch.git
cd mtianyanSearch
docker-compose up -d
git clone https://github.com/mtianyan/FunpySpiderSearchEngine
cd FunpySpiderSearchEngine
docker-compose up -d
เยี่ยมชม 127.0.0.1:8080
หากรหัสโครงการของฉันมีประโยชน์สำหรับคุณโปรดให้แถบเผ็ดมาให้ฉัน!