Dieses Repository enthält bulgarische ispell ( affix und dict ) und stopword -Wörterbücher für die Volltextsuche in Postgresql.
Die ispell Dictionary -Dateien ( bulgarian.affix und bulgarian.dict ) wurden vom Bgoffice/б о о фиис -Projekt zur Verwendung in OpenOffice erstellt und sind unter LGPL 3.0 lizenziert.
Dieses Repository enthält eine modifizierte Version dieser Dateien (geringfügige Änderungen), um sie mit dem von PostgreSQL erwarteten Format kompatibel zu machen. Die ursprünglichen ispell -Dateien ( bulgarian.aff und bulgarian.dic ) können von http://bgoffice.sourceforge.net/ispell/index.html heruntergeladen werden
Die in diesem Repository ( bulgarian.stop ) verwendete Stopp -Word -Liste ist eine geänderte Version der Liste "Suchstrategien für die bulgarische Sprache" (die Liste ist in Tabelle A.1) von Prof. Jacques Savoy.
C:Program FilesPostgreSQL12sharetsearch_data $SHAREDIR/tsearch_data/ bulgarian.stop drei Dateien bulgarian.affix bulgarian.dict Sie können bestimmen, was Ihr $SHAREDIR ist, indem Sie pg_config --sharedir ausführen.
Führen Sie das folgende SQL -Skript aus:
CREATE TEXT SEARCH CONFIGURATION bulgarian (COPY = simple);
CREATE TEXT SEARCH DICTIONARY bulgarian_ispell (
TEMPLATE = ispell,
DictFile = bulgarian,
AffFile = bulgarian,
StopWords = bulgarian
);
CREATE TEXT SEARCH DICTIONARY bulgarian_simple (
TEMPLATE = pg_catalog.simple,
STOPWORDS = bulgarian
);
ALTER TEXT SEARCH CONFIGURATION bulgarian ALTER MAPPING FOR asciiword, asciihword, hword, hword_part, word WITH bulgarian_ispell, bulgarian_simple;
Stellen Sie sicher, dass es funktioniert, indem Sie eine Volltextsuche -Abfrage ausführen.
Eine Abfrage wie diese:
SELECT to_tsvector('bulgarian', 'текстовете');
Sollte nur die Basis des Wortes ausgeben ( текст ):
`"'текст':1"`