تنزيل gifts_py - تنزيل رمز المصدر gifts

gifts_py

شفرة المصدر الأخرى

1.0.0

تنزيل

الهدايا

البحث عن عناصر لها ميزات شائعة مع الاستعلام.

 query = [ 'A' , 'B' ]

elements = [
    [ 'N' , 'A' , 'M' ],  # common features: 'A'
    [ 'C' , 'B' , 'A' ],  # common features: 'A', 'B'  
    [ 'X' , 'Y' ]  # no common features
]

في هذه الحالة ، البحث مع العودة ['C', 'B', 'A'] و ['N', 'A', 'M'] بهذا الترتيب بالذات.

استخدم للبحث عن النص الكامل

العثور على المستندات التي تحتوي على كلمات من الاستعلام.

 from gifts import SmoothFts

fts = SmoothFts ()

fts . add ([ "wait" , "mister" , "postman" ],
        doc_id = "doc1" )

fts . add ([ "please" , "mister" , "postman" , "look" , "and" , "see" ],
        doc_id = "doc2" )

fts . add ([ "oh" , "yes" , "wait" , "a" , "minute" , "mister" , "postman" ],
        doc_id = "doc3" )

# print IDs of documents in which at least one word of the query occurs, 
# starting with the most relevant matches
for doc_id in fts . search ([ 'postman' , 'wait' ]):
    print ( doc_id )

استخدم لاستخراج البيانات التجريدية

في الأمثلة المذكورة أعلاه ، كانت الكلمات حرفيًا كلمات كقواسل. ولكن يمكن أن تكون أي كائنات مناسبة كمفاتيح dict .

 from gifts import SmoothFts

fts = SmoothFts ()

fts . add ([ 3 , 1 , 4 , 1 , 5 , 9 , 2 ], doc_id = "doc1" )
fts . add ([ 6 , 5 , 3 , 5 ], doc_id = "doc2" )
fts . add ([ 8 , 9 , 7 , 9 , 3 , 2 ], doc_id = "doc3" )

for doc_id in fts . search ([ 5 , 3 , 7 ]):
    print ( doc_id )

تفاصيل التنفيذ

عند ترتيب النتائج ، تأخذ الخوارزمية في الاعتبار ::

عدد الكلمات المطابقة
ندرة مثل هذه الكلمات في قاعدة البيانات
تواتر حدوث الكلمات في المستند

السلس

 from gifts import SmoothFts

يستخدم tf-IDF اللوغاريتمي لتوضيح الكلمات وتشابه جيب التمام لتسجيل المباريات.

بسيطة

 from gifts import SimpleFts

نهج الحد الأدنى: وزن ، مضاعفة ، قارن. هذا الكائن أسرع بشكل ملحوظ من SmoothFts .

ثَبَّتَ

pip

pip3 install git+https://github.com/rtmigo/gifts_py#egg=gifts

الإعداد

 install_requires = [
    "gifts@ git+https://github.com/rtmigo/gifts_py"
]

انظر أيضا

تقوم حزمة Skifts بنفس البحث ، ولكنها تستخدم Scikit-Learn و Numpy لتحسين أداء. هو حرفيا مئات المرات أسرع.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-05-26
الحجم 15.53KB
من Github

تطبيقات ذات صلة

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
sentinel1 orbits py

2024-11-08
nextcloud_share_url_downloader

2024-11-01
محرك تحليل البيانات Lihua الإصدار المجاني 3.0_search_navigation_collection_public Oplic_ranking_api

2022-06-28

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل