تتكون Cluster Elasticsearch من مثالين Elasticsearch من أجل HA وموازنة التحميل. يتم تخزين بيانات الصفحة التي تم إلغاؤها وتفتيشها.
يعمل على المنفذ 5601 ويمكن استخدامه للتحقق من البيانات في Elasticsearch
واجهة الويب لمحرك البحث المجال. يعمل على الميناء 7000
يقوم بتخزين المجالات ، عناوين URL للصفحة ، عناوين البيتكوين ، إلخ.
تستخدم للوصول إلى صفحات البصل. هناك 10 حاويات وكيل تم نشرها ويتم استخدام haproxy لتوزيع حركة المرور.
يحصل على قائمة المجال من MySQL DB ، صفحات الحصاد والمجالات الجديدة من مجالات البصل من خلال الوكلاء TOR وتخزن المجالات وبيانات الصفحة في Elasticsearch و MySQL. استنادا إلى إطار SCRAPY PYTHON.
استنساخ المشروع وبناء صور Docker المشاركة في Docker-Cormse.
docker-compose build
docker-compose up -d
بناء وتشغيل مكشطة.
docker build --tag scraper_crawler ./
تشغيل مكشطة.
docker run -d --name darkweb-search-engine-onion-crawler --network=darkweb-search-engine_default scraper_crawler /opt/torscraper/scripts/start_onion_scrapy.sh
بعد النشر الأول ، تحتاج إلى تهيئة الفهارس على Elasticsearch.
docker exec darkweb-search-engine-onion-crawler /opt/torscraper/scripts/elasticsearch_migrate.sh
استيراد قائمة المجال الأولي
docker exec darkweb-search-engine-onion-crawler /opt/torscraper/scripts/push_list.sh /opt/torscraper/onions_list/onions.txt &