Darkweb search engine
1.0.0
ElasticSearchクラスターは、HAとロードバランシング用の2つのElasticSearchインスタンスで構成されています。廃棄されたページデータは保存されて検索されます。
ポート5601で実行され、ElasticSearchのデータを確認するために使用できます
ドメイン検索エンジンのWebインターフェイス。ポート7000で実行されます
ドメイン、ページURL、ビットコインアドレスなどを保存します。
オニオンページにアクセスするために使用されます。 10個のプロキシコンテナが展開されており、ハプロキシを使用してトラフィックを配布します。
MySQL DB、Harvest Pages、およびOnionドメインからの新しいドメインからドメインリストを取得します。 Python Scrapyフレームワークに基づいています。
プロジェクトをクローンし、Docker-Composeに関与するDocker画像を構築します。
docker-compose build
docker-compose up -d
スクレーパーを構築して実行します。
docker build --tag scraper_crawler ./
スクレーパーを実行します。
docker run -d --name darkweb-search-engine-onion-crawler --network=darkweb-search-engine_default scraper_crawler /opt/torscraper/scripts/start_onion_scrapy.sh
最初に展開した後、ElasticSearchのインデックスを初期化する必要があります。
docker exec darkweb-search-engine-onion-crawler /opt/torscraper/scripts/elasticsearch_migrate.sh
初期ドメインリストをインポートします
docker exec darkweb-search-engine-onion-crawler /opt/torscraper/scripts/push_list.sh /opt/torscraper/onions_list/onions.txt &