Repositori ini berisi ispell Bulgaria ( affix dan dict ) dan kamus stopword untuk pencarian teks lengkap di postgresql.
File Kamus ispell ( bulgarian.affix dan bulgarian.dict ) telah dibuat oleh BGOffice/б офис Project untuk digunakan di OpenOffice dan dilisensikan di bawah LGPL 3.0.
Repositori ini berisi versi yang dimodifikasi dari file -file tersebut (perubahan kecil) untuk membuatnya kompatibel dengan format yang diharapkan oleh PostgreSQL. File ispell asli ( bulgarian.aff dan bulgarian.dic ) dapat diunduh dari http://bgoffice.sourceforge.net/ispell/index.html
Daftar kata -kata berhenti yang digunakan dalam repositori ini ( bulgarian.stop ) adalah versi yang dimodifikasi dari daftar yang diterbitkan dalam artikel "Strategi Pencarian untuk Bahasa Bulgaria" (daftarnya ada di Tabel A.1) oleh Prof. Jacques Savoy.
Salin tiga file bulgarian.affix , bulgarian.dict dan bulgarian.stop ke $SHAREDIR/tsearch_data/ Direktori Anda (mis. C:Program FilesPostgreSQL12sharetsearch_data ). Anda dapat menentukan apa $SHAREDIR Anda dengan menjalankan pg_config --sharedir .
Jalankan skrip SQL berikut:
CREATE TEXT SEARCH CONFIGURATION bulgarian (COPY = simple);
CREATE TEXT SEARCH DICTIONARY bulgarian_ispell (
TEMPLATE = ispell,
DictFile = bulgarian,
AffFile = bulgarian,
StopWords = bulgarian
);
CREATE TEXT SEARCH DICTIONARY bulgarian_simple (
TEMPLATE = pg_catalog.simple,
STOPWORDS = bulgarian
);
ALTER TEXT SEARCH CONFIGURATION bulgarian ALTER MAPPING FOR asciiword, asciihword, hword, hword_part, word WITH bulgarian_ispell, bulgarian_simple;
Pastikan ini bekerja dengan menjalankan kueri pencarian teks lengkap.
Permintaan seperti ini:
SELECT to_tsvector('bulgarian', 'текстовете');
harus menghasilkan hanya basis kata ( текст ):
`"'текст':1"`