postgres tsearch bulgarian
1.0.0
該存儲庫包含保加利亞ispell ( affix和dict )和stopword詞典,用於PostgreSQL中的全文搜索。
ispell字典文件( bulgarian.affix和bulgarian.dict )是由Bgoffice/購項目創建的,可用於OpenOffice,並根據LGPL 3.0獲得許可。
該存儲庫包含這些文件的修改版本(較小的更改),以使其與PostgreSQL期望的格式兼容。可以從http://bgoffice.sourceforge.net/ispell/index.html下載原始的ispell文件( bulgarian.aff和bulgarian.dic )。
此存儲庫中使用的停止單詞列表( bulgarian.stop )是文章“保加利亞語言的搜索策略”中發布的列表的修改版本(該列表在表A.1中),由Jacques Savoy教授教授。
bulgarian.stop $SHAREDIR/tsearch_data/ C:Program FilesPostgreSQL12sharetsearch_data bulgarian.affix bulgarian.dict您可以通過運行pg_config --sharedir來確定$SHAREDIR是什麼。
執行以下SQL腳本:
CREATE TEXT SEARCH CONFIGURATION bulgarian (COPY = simple);
CREATE TEXT SEARCH DICTIONARY bulgarian_ispell (
TEMPLATE = ispell,
DictFile = bulgarian,
AffFile = bulgarian,
StopWords = bulgarian
);
CREATE TEXT SEARCH DICTIONARY bulgarian_simple (
TEMPLATE = pg_catalog.simple,
STOPWORDS = bulgarian
);
ALTER TEXT SEARCH CONFIGURATION bulgarian ALTER MAPPING FOR asciiword, asciihword, hword, hword_part, word WITH bulgarian_ispell, bulgarian_simple;
通過運行全文搜索查詢來確保其工作。
這樣的查詢:
SELECT to_tsvector('bulgarian', 'текстовете');
應僅輸出單詞的底部( текст ):
`"'текст':1"`