คลัสเตอร์ Elasticsearch ประกอบด้วยอินสแตนซ์ Elasticsearch 2 ตัวอย่างสำหรับ HA และ Load Balancing ข้อมูลหน้าเว็บที่ถูกทิ้งจะถูกจัดเก็บและค้นหา
มันทำงานบนพอร์ต 5601 และสามารถใช้เพื่อตรวจสอบข้อมูลใน Elasticsearch
เว็บอินเตอร์เฟสสำหรับเครื่องมือค้นหาโดเมน มันทำงานบนพอร์ต 7000
มันเก็บโดเมน, URL หน้า, ที่อยู่ Bitcoin ฯลฯ
ใช้ในการเข้าถึงหน้าหัวหอม มีการปรับใช้คอนเทนเนอร์พร็อกซี 10 ตัวและใช้ Haproxy เพื่อแจกจ่ายปริมาณการใช้งาน
มันได้รับรายการโดเมนจาก MySQL DB, หน้าเก็บเกี่ยวและโดเมนใหม่จากโดเมนหัวหอมผ่านพร็อกซี TOR และเก็บข้อมูลโดเมนและหน้าใน Elasticsearch และ MySQL ขึ้นอยู่กับเฟรมเวิร์ก Scrapy Python
โคลนโครงการและสร้างภาพนักเทียบท่าที่เกี่ยวข้องกับนักเทียบท่า
docker-compose build
docker-compose up -d
สร้างและเรียกใช้มีดโกน
docker build --tag scraper_crawler ./
เรียกใช้มีดโกน
docker run -d --name darkweb-search-engine-onion-crawler --network=darkweb-search-engine_default scraper_crawler /opt/torscraper/scripts/start_onion_scrapy.sh
หลังจากการปรับใช้ครั้งแรกต้องเริ่มต้นดัชนีใน Elasticsearch
docker exec darkweb-search-engine-onion-crawler /opt/torscraper/scripts/elasticsearch_migrate.sh
นำเข้ารายการโดเมนเริ่มต้น
docker exec darkweb-search-engine-onion-crawler /opt/torscraper/scripts/push_list.sh /opt/torscraper/onions_list/onions.txt &