DocIndex는 서버 측 문서 검색을 간단하게 할 수있는 프론트 엔드에서 Elasticsearch의 프론트 엔드 인 Docmag를 공급하는 데 사용되는 배치 프로세스입니다.
DocIndex는 OS에서 직접 실행할 수 있지만 Docker 컨테이너 내에서 실행하는 것이 좋습니다. 컨테이너는 docmag docker-compose.yml 내에서 구성됩니다.
일반적으로 DocIdx를 로컬로 빌드하고 실행하고 싶지 않으며 대신 https://hub.docker.com/r/deckerego/docidx/에 게시 된 Docker 컨테이너를 실행하는 것이 가장 좋습니다.
DocIDX는 컴퓨터 비전 및 이미지 처리에 크게 의존하기 때문에 기본 라이브러리에 대한 바인딩이 많이 사용됩니다. 기본 라이브러리가있는 포장 된 Java 분포는 엉덩이에 거대한 통증이므로 Docker 컨테이너를 활용하여 기본적으로 물건을 배송합니다. DocIdx를 올리거나 실행하려면 Docker를 실행하는 것이 가장 쉬운 방법이지만 코드를 조정하고 로컬로 실행하려면 기본 Libs를 설치하려면 일부 후프를 뛰어 넘어야합니다.
DOCIDX는 OpenCV 및 TesserAct 기본 라이브러리에 바인딩을 사용합니다. OpenCV 라이브러리는 특히 버전에 민감합니다. MacOS에 기본 TesseAract 라이브러리를 설치하려면 다음과 같이 홈 브루를 사용할 수 있습니다.
brew install tesseract
불행히도 OpenCV 3.2는 홈브류 아래에 제대로 구축되지 않습니다. MacOS의 경우 OpenCV는 소스에서 구축해야합니다. 이것은 다음과 같이 수행 할 수 있습니다.
wget https://github.com/opencv/opencv/archive/3.2.0.tar.gz
tar xzf 3.2.0.tar.gz
mkdir opencv-3.2.0/build
cd opencv-3.2.0/build
cmake .. -DBUILD_opencv_java=ON
make
make install
Linux 배포판은 종종 Ubuntu (Bionic)와 같은 Tesseract 및 OpenCV 3.2로 배송됩니다.
apt-get install tesseract-ocr libopencv3.2-jni
기본 라이브러리가 설치된 후 Maven 및 Spring Boot를 사용하여 건물 및 테스트를 현지에서 수행 할 수 있습니다.
mvn -DargLine="-Djava.library.path=/usr/local/share/OpenCV/java/" install
테스트를 위해 로컬 Elasticsearch 및 Kibana 인스턴스를 돌려 보려면 tests/ Directory에서 Docker Configs를 모두 배포 할 수 있습니다.
cd tests
docker-compose up -d
문서 내에서 검색하려면 https://github.com/deckerego/docmag에서 사용 가능한 docmag를 사용하십시오.
API 또는 Kibana의 개발 도구를 사용하여 Elasticsearch를 직접 쿼리 할 수도 있습니다. API를 통해 전송 된 쿼리는 다음과 같습니다.
GET /docidx/_search
{"query": { "simple_query_string" :
{ "query": "water bill" }
}}