postgres tsearch bulgarian
1.0.0
该存储库包含保加利亚ispell ( affix和dict )和stopword词典,用于PostgreSQL中的全文搜索。
ispell字典文件( bulgarian.affix和bulgarian.dict )是由Bgoffice/购项目创建的,可用于OpenOffice,并根据LGPL 3.0获得许可。
该存储库包含这些文件的修改版本(较小的更改),以使其与PostgreSQL期望的格式兼容。可以从http://bgoffice.sourceforge.net/ispell/index.html下载原始的ispell文件( bulgarian.aff和bulgarian.dic )。
此存储库中使用的停止单词列表( bulgarian.stop )是文章“保加利亚语言的搜索策略”中发布的列表的修改版本(该列表在表A.1中),由Jacques Savoy教授教授。
bulgarian.stop $SHAREDIR/tsearch_data/ C:Program FilesPostgreSQL12sharetsearch_data bulgarian.affix bulgarian.dict您可以通过运行pg_config --sharedir来确定$SHAREDIR是什么。
执行以下SQL脚本:
CREATE TEXT SEARCH CONFIGURATION bulgarian (COPY = simple);
CREATE TEXT SEARCH DICTIONARY bulgarian_ispell (
TEMPLATE = ispell,
DictFile = bulgarian,
AffFile = bulgarian,
StopWords = bulgarian
);
CREATE TEXT SEARCH DICTIONARY bulgarian_simple (
TEMPLATE = pg_catalog.simple,
STOPWORDS = bulgarian
);
ALTER TEXT SEARCH CONFIGURATION bulgarian ALTER MAPPING FOR asciiword, asciihword, hword, hword_part, word WITH bulgarian_ispell, bulgarian_simple;
通过运行全文搜索查询来确保其工作。
这样的查询:
SELECT to_tsvector('bulgarian', 'текстовете');
应仅输出单词的底部( текст ):
`"'текст':1"`