Darkweb search engine
1.0.0
Elasticsearch群集由2個用於HA和負載平衡的Elasticsearch實例。廢棄的頁面數據存儲和搜索。
它在端口5601上運行,可用於檢查Elasticsearch中的數據
域搜索引擎的Web界面。它在端口7000上運行
它存儲域,頁面URL,比特幣地址等。
用於訪問洋蔥頁。部署了10個代理容器,使用Haproxy來分發流量。
它從MySQL DB,收穫頁面和新域中從洋蔥域中獲取域列表,並通過Tor Proxies從Elasticsearch和MySQL中存儲域和頁面數據。基於Python廢紙框架。
克隆項目並構建涉及Docker-Compose的Docker圖像。
docker-compose build
docker-compose up -d
構建並運行刮板。
docker build --tag scraper_crawler ./
運行刮板。
docker run -d --name darkweb-search-engine-onion-crawler --network=darkweb-search-engine_default scraper_crawler /opt/torscraper/scripts/start_onion_scrapy.sh
首次部署後,需要在Elasticsearch上初始化索引。
docker exec darkweb-search-engine-onion-crawler /opt/torscraper/scripts/elasticsearch_migrate.sh
導入初始域名
docker exec darkweb-search-engine-onion-crawler /opt/torscraper/scripts/push_list.sh /opt/torscraper/onions_list/onions.txt &