coresearch
v1.0.0
.NET Core Cross-Platform, Memory, 전체 텍스트 검색 라이브러리 구축 검색 엔진
Coresearch는 컨텐츠에서 자원으로 원자 검색 기준을 색인화하기 위해 부스트 트리 데이터 구조가 장착 된 역 색인을 사용합니다. Trie 알고리즘은 Coresearch를보다 탄력적으로 만들고 퍼지 검색, 와일드 카드 및 캐릭터 매칭과 같은 정확한 단어 쿼리 및 작업을 모두 허용합니다. 전체 트리 구조는 더 나은 성능을 위해 메모리에 저장됩니다. 전체 프로젝트는 학습 프로젝트로 작성되었으므로 프로덕션에 참여하는 것을 알고 있습니다.
위키 백과에 트리
source <string path> <string extension>
alias: load
예:
> source ./ *.txt
get <string key>
alias: search
예:
> search cars
output:
<resource names for key cars>
쿼리 모드 :
query <string prefix> <query mode: . or *>
example 1:
> query c ?
output:
<resource names for keys: ca, cb, c5, co, c1, ...>
example 2:
> query c *
output:
<resource names for keys: ca, cabbage, c4a541, cars, cardio, cantaloupe, ...>
example 3:
> query cars
output:
<resource names for key cars>
add <string resource name> <string content>
alias: insert
예:
> add english-dict.txt house
delete <string key>
예:
> delete sport
echo <string content>
예:
> echo hello
output:
hello
debug <bool>
예:
> debug true
flush
예:
> flush
info
예:
> flush
output:
Nodes in trie: 4651175
Words inserted: 15513389
Resource files: 2227
Memory usage: 1044944640 bytes
clear
예:
> clear
디버그 모드를 돌립니다
--debug <bool>
-d
메모리의 최대 크기 설정 (바이트)
--memory-limit <int>
-m
삽입하기 전에 모든 단어를 사전 처리하십시오
--normalize <bool>
-n
원치 않는 문자를 제거하기위한 패턴, 삽입 전에 각 단어에 사용
--pattern <regex>
-p
시작시 특정 경로에서 데이터를로드합니다
--source <string>
-s
시작시 데이터를로드하기위한 확장을 설정하십시오
--extension <string>
-e
Coresearch는 MIT에 따라 라이센스가 부여됩니다.