؟
أوجه التشابه : مجموعة أدوات لحساب التشابه والبحث الدلالي ، تدعم النص والصورة.
تنفذ أوجه التشابه مجموعة متنوعة من حسابات التشابه وخوارزميات استرجاع المطابقة الدلالية للنص والصور ، ويدعم مليارات من البحث عن البيانات ، والبحث عن النص ، والبحث عن الصور ، وتطوير Python3 ، وتثبيت PIP ، وخارج المربع.
مرشد
البحث عن الصور التوضيحي: https://huggingface.co/spaces/shibing624/clip-image-search

توضيح البحث عن النص: https://huggingface.co/spaces/shibing624/similarities

pip install torch # conda install pytorch
pip install -U similarities
أو
git clone https://github.com/shibing624/similarities.git
cd similarities
pip install -e .
مثال: أمثلة/text_similarity_demo.py
from similarities import BertSimilarity
m = BertSimilarity ( model_name_or_path = "shibing624/text2vec-base-chinese" )
r = m . similarity ( '如何更换花呗绑定银行卡' , '花呗更改绑定银行卡' )
print ( f"similarity score: { float ( r ) } " ) # similarity score: 0.855146050453186model_name_or_path : سيتم تنزيل اسم النموذج أو المسار من HF Model Hub بشكل افتراضي ويتم استخدام نموذج المطابقة الدلالية الصينية Shibing624/text2vec-base-chinese ، ويمكن استبداله بـ Multipual ، والكوريان ، والكوريان ، واللجنة الأخرى ، واللجنة الأخرى ، واللجنة.ابحث عن النص الأكثر تشابهًا مع الاستعلام في مجموعة مرشح المستند ، والذي يتم استخدامه غالبًا في المباريات المماثلة وعمليات البحث النصية في سيناريوهات ضمان الجودة.
مثال: أمثلة/text_semantic_search_demo.py
مثال: أمثلة/fast_text_semantic_search_demo.py
ناقل نقل النص ، فهرسة ، بحث الدُفعات ، بدء الخدمة: أمثلة/faiss_bert_search_server_demo.py
استدعاء Python الواجهة الأمامية: أمثلة/faiss_bert_search_client_demo.py
وهو يدعم حساب التشابه والبحث عن المطابقة الحرفية عن مرادفات مثل Cilin ، CNKI Hownet ، WordEmbedding ، TFIDF ، Simhash ، BM25 ، وما إلى ذلك ، وغالبًا ما يتم استخدامها في بداية النصوص الباردة.
مثال: أمثلة/piteral_text_semantic_search_demo.py
يدعم حساب تشابه الصورة والبحث عن خوارزميات مثل المقطع ، والتشبؤ ، و SIFT.
مثال: أمثلة/image_semantic_search_demo.py

ناقلات تحول الصور ، الفهرسة ، البحث الدُفعات ، خدمة البدء: أمثلة/faiss_clip_search_server_demo.py
استدعاء Python الواجهة الأمامية: أمثلة/faiss_clip_search_client_demo.py
مكالمة Gradio الواجهة الأمامية: أمثلة/faiss_clip_search_gradio_demo.py

يمكن إجراء التجميع على مجموعات بيانات واسعة النطاق من خلال خوارزميات Community_Detection للعثور على التجميع (أي مجموعات جملة مماثلة).
مثال: أمثلة/text_clustering_demo.py
يمكن استخدام خوارزمية تعدين الجملة المرادف (paraphrase_mining_embeddings) لتنص على أزواج الجملة مع معاني مماثلة من عدد كبير من الجمل أو المستندات ، والتي يمكن استخدامها للكشف عن الرسومات والكشف عن النصوص ودايتها.
الكود: cli.py
> similarities -h
NAME
similarities
SYNOPSIS
similarities COMMAND
COMMANDS
COMMAND is one of the following:
bert_embedding
Compute embeddings for a list of sentences
bert_index
Build indexes from text embeddings using autofaiss
bert_filter
Entry point of bert filter, batch search index
bert_server
Main entry point of bert search backend, start the server
clip_embedding
Embedding text and image with clip model
clip_index
Build indexes from embeddings using autofaiss
clip_filter
Entry point of clip filter, batch search index
clip_server
Main entry point of clip search backend, start the server
يجري:
pip install similarities -U
similarities clip_embedding -h
# example
cd examples
similarities clip_embedding data/toy_clip/bert_embedding وما إلى ذلك هي أوامر ثانوية.similarities clip_embedding -hdata/toy_clip/ هي معلمة input_dir لطريقة clip_embedding ، وأدخل دليل الملف (مطلوب) 
إذا كنت تستخدم أوجه التشابه في بحثك ، فيرجى اقتباسها بالتنسيق التالي:
APA:
Xu, M. Similarities: Compute similarity score for humans (Version 1.0.1) [Computer software]. https://github.com/shibing624/similarities
bibtex:
@misc{Xu_Similarities_Compute_similarity,
title={Similarities: similarity calculation and semantic search toolkit},
author={Xu Ming},
year={2022},
howpublished={url{https://github.com/shibing624/similarities}},
}
اتفاقية الترخيص هي ترخيص Apache 2.0 ، والذي يمكن استخدامه لأغراض تجارية مجانًا. يرجى إرفاق اتفاقية الرابط والترخيص بوصف المنتج.
لا يزال رمز المشروع قاسيًا للغاية.
testspython -m pytest لتشغيل جميع اختبارات الوحدة لضمان اجتياز جميع الاختبارات الفرديةيمكنك تقديم العلاقات العامة الخاصة بك لاحقًا.
شكرا لعملهم العظيم!