ES-Indexer (Elasticsearch Indexer)-это простой инструмент для одновременной командной строки, написанный на Python, который поможет вам быстро заполнить некоторые данные JSON в Elasticsearch.
Обычно вам приходится использовать стороннее программное обеспечение или клиентскую библиотеку для индекса данных для Elasticsearch , и настройка, которое может быть действительно трудоемким и утомительным (кашель кашель ) . ES-Indexer помогает быстро индексировать необработанное содержимое *.json .
ES-Indexer в настоящее время не обеспечивает никакой синхронизации данных, вам придется повторно переоценить данные, если они изменятся, но всегда будут заполнять новый индекс, а затем создавать псевдоним, старые данные будут присутствовать при повторном индексе, пока новый индекс не будет полностью заполнен. Будущее обновление может включать синхронизацию.
Поскольку Elasticsearch обнажает REST-API на порту 9200, нет необходимости в ES-индексере, обеспечивающем сам REST-API.
Требуется Python 3.x и совместим с Elasticsearch 7.xx
$ pip install es-indexer
(ИЛИ)
Клонировать репозиторий.
$ git clone https://github.com/itsron717/es-indexer.git
Перейти внутрь репо.
$ cd es-indexer
Установите пакет локально.
$ pip install .
Вам нужно создать config.yml перед запуском es-indexer:
host: http://127.0.0.1:9200
index: twitter-example
type: documents
mapping:
settings:
number_of_shards: 1
number_of_replicas: 0
Вы можете предоставить пользовательское отображение в файле конфигурации, ES-Indexer будет преобразовать картирование YAML 1: 1 в JSON.
$ es-indexer --config path/to/config/file --source path/to/json/folder
В инструмент ES-Indexer также следует добавить больше источников данных, кроме json , SQL , Filesystem и т. Д. Любой, кто хотел бы внести свой вклад в интеграцию других источников данных, может поднять и выпустить, и мы можем начать работать над этим!
json . SQL . FileSystem . ES-Indexer был построен с использованием накидки этого удивительного инструмента, написанного в Go.
Лицензия MIT (MIT)
Copyright (C) 2019 Rounak Vyas