ES-Indexer (Elasticsearch Indexer) هي أداة سطر أوامر متزامنة بسيطة مكتوبة في Python لمساعدتك بسرعة على ملء بعض بيانات JSON في Elasticsearch.
عادةً ما يتعين عليك استخدام برنامج طرف ثالث أو مكتبة عميل لفهرسة البيانات إلى Elasticsearch والإعداد الذي يمكن أن يكون مضيعة للوقت ومرهقة ( سعال Logstash السعال ). يساعد ES-Indexer في فهرسة محتويات *.json المستندات بسرعة بمساعدة متعددة الخيوط.
لا يوفر ES-Indexer حاليًا أي مزامنة للبيانات ، فسيتعين عليك أن تكرر البيانات إذا تغيرت ، ولكنها ستقوم دائمًا بتعبئة فهرس جديد ثم إنشاء اسم مستعار ، وستكون البيانات القديمة موجودة أثناء إعادة الفهرس حتى يتم ملء الفهرس الجديد بالكامل. قد يتضمن التحديث المستقبلي المزامنة.
نظرًا لأن Elasticsearch يعرض REST-API على المنفذ 9200 ، فليس هناك حاجة إلى ES-Indexer التي توفر REST-API نفسها.
يتطلب Python 3.x ومتوافق مع Elasticsearch 7.xx
$ pip install es-indexer
(أو)
استنساخ المستودع.
$ git clone https://github.com/itsron717/es-indexer.git
تحرك داخل الريبو.
$ cd es-indexer
تثبيت الحزمة محليا.
$ pip install .
تحتاج إلى إنشاء config.yml قبل تشغيل ES-Indexer:
host: http://127.0.0.1:9200
index: twitter-example
type: documents
mapping:
settings:
number_of_shards: 1
number_of_replicas: 0
يمكنك توفير تعيين مخصص في ملف التكوين ، وسيقوم ES-INDEXER بتحويل تعيين YAML 1: 1 إلى JSON.
$ es-indexer --config path/to/config/file --source path/to/json/folder
يتم أيضًا إضافة المزيد من مصادر البيانات بخلاف json مثل SQL ، Filesystem ، وما إلى ذلك إلى أداة ES-Indexer بحيث يمكن أن يكون متجرًا واحدًا لجميع احتياجات الفهرسة لـ Elasticsearch. يمكن لأي شخص يرغب في المساهمة في دمج مصادر البيانات الأخرى رفع وإصدارنا ويمكننا البدء في العمل عليها!.
json . SQL . FileSystem . تم بناء ES-Indexer باستخدام غير ملحق هذه الأداة المذهلة المكتوبة في GO.
ترخيص معهد ماساتشوستس للتكنولوجيا (MIT)
حقوق الطبع والنشر (C) 2019 Rounak Vyas