استخدام التكنولوجيا golang+goleveldb
نظام قاعدة بيانات Xiaobai المدمج (نظام قاعدة بيانات فهرس النص الكامل على مستوى النص) ، "فهرس النص الكامل" المدمج ، لا حاجة إلى تجزئة القاموس ، ولكن لا توجد كلمات لا يمكن البحث عنها أبدًا.
تم تحسين الأبحاث تدريجياً وتحسينها من محرك بحث Qianlong Tripitaka الأصلي "و" Siku Quanshu Search Engine ".
يمكن استخدامه لتنظيم كمية كبيرة من المعلومات ولديه وظيفة بحث على مستوى النص.
يمكن استخدامه أيضًا كوسيط بحث ، مثل: Site Search ؛
لا تتطلب تقنية تجزئة الكلمات التي تم تطويرها بشكل مستقل ، وهي تقنية اختراق لمحركات البحث ، تجزئة المفردات ، ومعدل نجاح البحث هو 100 ٪.
Thesaurus هو جوهر محركات البحث. كلمة تجزئة هي عيون محركات البحث. بدون عيون ، لا يمكنك رؤية أي شيء والبحث عن لا شيء.
ومع ذلك ، يصعب بشكل أساسي الكمال قاعدة بيانات المفردات ، ومن المستحيل تحقيق الاكتمال. لذلك ، يجب أن يكون هناك بعض الكلمات التي لا يمكن البحث عنها.
خاصة بالنسبة للكلمات الجديدة ، من المستحيل البحث عن كلمات جديدة في المرة الأولى لأنه لا يوجد في مكتبة المفردات.
إذا كان لا يمكن البحث في كلمات جديدة ، فهذا يعادل قتل القوة الدافعة للابتكار ، وخاصة في مجال التجارة الإلكترونية.
حتى إذا أضافت إدارة تجزئة الكلمات كلمات جديدة إلى المكتبة في أقرب وقت ممكن ، للبحث ، فمن الضروري أن تمر عبر جميع البيانات الأصلية للحصول على النتيجة.
كلما زاد حجم بيانات النظام ، زادت حذرًا هو إضافة كلمات جديدة وأبطأ الوقت.
البحث ، يتخلى عن القاموس.
إذا كانت مكتبة تجزئة الكلمات هي عيون محركات البحث الأخرى ، فإن هذه العين هي العين العارية. العيون التي تجتاز النعت هي العيون السماوية.
ستؤدي تقنيات تجزئة الكلمات الأخرى إلى احتمال عدم القدرة على البحث عن نتائج بسبب عدم اكتمال قاعدة بيانات تجزئة الكلمات. بمعنى آخر ، معدل نجاح البحث هو 100 ٪.
لإعطاء مثال متطرف:
اقلب كل مقالة رأسًا على عقب وابحث مع الكلمات العكسية أيضًا.
من المحتمل أن تكون تقنيات النعت الأخرى غير قادرة على البحث عن أي شيء.
معدل نجاح البحث هو 100 ٪ في تقنية تجزئة الكلمات.
يمكنك تخصيص التفاصيل البحث.
محركات البحث الشائعة مثل Google و Baidu ، فإن التفاصيل الدقيقة هي المقالة بأكملها.
البحث ، يمكنك التخصيص إلى الفقرات والجمل وما إلى ذلك.
عادة ، يتم تعريف التفاصيل الدقيقة على أنها جملة.
عشرات المليارات من البيانات ، استجابة مللي ثانية.
نظرًا لعدم وجود حاجة إلى تجزئة الكلمات ولا حاجة لتحليل تجزئة الكلمات ، فإنه يحتوي على أداء أعلى من محركات البحث مع تقنيات تجزئة الكلمات الأخرى.
أضف عمليات البحث في الوقت الفعلي في الوقت الحقيقي.
تتطلب بيانات النص على مستوى 10G فقط عشرات M من الذاكرة.
افتح الملف القابل للتنفيذ للنظام المقابل ثم تشغيله.