.NET CORT-PLATFORM CROSSFAL, IN-MEMORY, PERPUSTAKAAN PENCARIAN Teks Lengkap untuk membangun mesin pencari
Coresearch menggunakan indeks terbalik dengan struktur data trie yang ditingkatkan untuk mengindeks kriteria pencarian atom dari konten ke sumber daya. Algoritma TRIE membuat Coresearch lebih elastis dan memungkinkan kueri kata yang tepat dan operasi seperti pencarian fuzzy, wildcard dan pencocokan karakter. Seluruh struktur trie disimpan dalam memori untuk kinerja yang lebih baik. Seluruh proyek ditulis sebagai proyek pembelajaran jadi waspadai memasang produksi
Trie di wikipedia
source <string path> <string extension>
alias: load
contoh:
> source ./ *.txt
get <string key>
alias: search
contoh:
> search cars
output:
<resource names for key cars>
Mode kueri:
query <string prefix> <query mode: . or *>
Contoh 1:
> query c ?
output:
<resource names for keys: ca, cb, c5, co, c1, ...>
Contoh 2:
> query c *
output:
<resource names for keys: ca, cabbage, c4a541, cars, cardio, cantaloupe, ...>
Contoh 3:
> query cars
output:
<resource names for key cars>
add <string resource name> <string content>
alias: insert
contoh:
> add english-dict.txt house
delete <string key>
contoh:
> delete sport
echo <string content>
contoh:
> echo hello
output:
hello
debug <bool>
contoh:
> debug true
flush
contoh:
> flush
info
contoh:
> flush
output:
Nodes in trie: 4651175
Words inserted: 15513389
Resource files: 2227
Memory usage: 1044944640 bytes
clear
contoh:
> clear
Putar mode debug
--debug <bool>
-d
Atur ukuran max memori (dalam byte)
--memory-limit <int>
-m
Pra-proses setiap kata sebelum dimasukkan
--normalize <bool>
-n
Pola untuk menghapus karakter yang tidak diinginkan, digunakan untuk setiap kata sebelum dimasukkan
--pattern <regex>
-p
Muat data dari jalur tertentu saat mulai
--source <string>
-s
Atur ekstensi untuk memuat data saat start
--extension <string>
-e
Coresearch dilisensikan di bawah MIT.