ที่เก็บนี้มี Bulgarian ispell ( affix และ dict ) และพจนานุกรมคำ stopword สำหรับการค้นหาข้อความแบบเต็มใน PostgreSQL
ไฟล์พจนานุกรม ispell ( bulgarian.affix และ bulgarian.dict ) ถูกสร้างขึ้นโดยโครงการ Bgoffice/бгисสำหรับใช้ใน OpenOffice และได้รับใบอนุญาตภายใต้ LGPL 3.0
ที่เก็บนี้มีไฟล์ที่แก้ไขแล้ว (การเปลี่ยนแปลงเล็กน้อย) เพื่อให้เข้ากันได้กับรูปแบบที่คาดหวังโดย PostgreSQL ไฟล์ ispell ต้นฉบับ ( bulgarian.aff และ bulgarian.dic ) สามารถดาวน์โหลดได้จาก http://bgoffice.sourceforge.net/ispell/index.html
รายการคำหยุดที่ใช้ในพื้นที่เก็บข้อมูลนี้ ( bulgarian.stop ) เป็นเวอร์ชันที่แก้ไขของรายการที่เผยแพร่ในบทความ "กลยุทธ์การค้นหาภาษาบัลแกเรีย" (รายการอยู่ในตาราง A.1) โดยศาสตราจารย์ Jacques Savoy
คัดลอกสามไฟล์ bulgarian.affix , bulgarian.dict และ bulgarian.stop ไปยัง $SHAREDIR/tsearch_data/ ไดเรกทอรีของคุณ (เช่น C:Program FilesPostgreSQL12sharetsearch_data ) คุณสามารถกำหนดว่า $SHAREDIR ของคุณคืออะไรโดยใช้ pg_config --sharedir
เรียกใช้สคริปต์ SQL ต่อไปนี้:
CREATE TEXT SEARCH CONFIGURATION bulgarian (COPY = simple);
CREATE TEXT SEARCH DICTIONARY bulgarian_ispell (
TEMPLATE = ispell,
DictFile = bulgarian,
AffFile = bulgarian,
StopWords = bulgarian
);
CREATE TEXT SEARCH DICTIONARY bulgarian_simple (
TEMPLATE = pg_catalog.simple,
STOPWORDS = bulgarian
);
ALTER TEXT SEARCH CONFIGURATION bulgarian ALTER MAPPING FOR asciiword, asciihword, hword, hword_part, word WITH bulgarian_ispell, bulgarian_simple;
ตรวจสอบให้แน่ใจว่ามันทำงานได้โดยเรียกใช้ข้อความค้นหาข้อความแบบเต็ม
แบบสอบถามแบบนี้:
SELECT to_tsvector('bulgarian', 'текстовете');
ควรส่งออกเฉพาะฐานของคำ ( текст ):
`"'текст':1"`