تحتوي هذه الحزمة على مرافق لتصور نماذج Spacy وبناء تطبيقات تفاعلية تعمل بالطاقة مع SPACELIT. ويشمل العديد من لبنات البناء التي يمكنك استخدامها في تطبيق SPEMATLIT الخاص بك ، مثل المرئيات للتبعيات النحوية ، والكيانات المسماة ، وتصنيف النص ، والتشابه الدلالي عبر متجهات الكلمات ، وسمات الرمز المميز ، والمزيد.

يمكنك تثبيت spacy-streamlit من PIP:
pip install spacy-streamlit تتضمن الحزمة اللبنات الأساسية التي تتصل بـ STIPLELIT وإعداد جميع العناصر المطلوبة لك. يمكنك إما استخدام المكونات الفردية مباشرة ودمجها مع عناصر أخرى في التطبيق الخاص بك ، أو الاتصال بوظيفة visualize لتضمين المصور بأكمله.
قم بتنزيل نموذج اللغة الإنجليزية من Spacy للبدء.
python -m spacy download en_core_web_smثم ضع رمز المثال التالي في ملف.
# streamlit_app.py
import spacy_streamlit
models = [ "en_core_web_sm" , "en_core_web_md" ]
default_text = "Sundar Pichai is the CEO of Google."
spacy_streamlit . visualize ( models , default_text ) يمكنك بعد ذلك تشغيل تطبيقك باستخدام streamlit run streamlit_app.py . يجب أن يطفو التطبيق في متصفح الويب الخاص بك. ؟
01_out-of-the-box.pyاستخدم المرئي المدمج مع إعدادات مخصصة خارج الصندوق.
streamlit run https://raw.githubusercontent.com/explosion/spacy-streamlit/master/examples/01_out-of-the-box.py02_custom.pyاستخدم المكونات الفردية في تطبيقك الحالي.
streamlit run https://raw.githubusercontent.com/explosion/spacy-streamlit/master/examples/02_custom.py يمكن استخدام هذه الوظائف في تطبيق SPEREMLIT الخاص بك. يدعون إلى streamlit تحت غطاء محرك السيارة وإعداد العناصر المطلوبة.
visualizeتضمين المصور الكامل مع مكونات محددة.
import spacy_streamlit
models = [ "en_core_web_sm" , "/path/to/model" ]
default_text = "Sundar Pichai is the CEO of Google."
visualizers = [ "ner" , "textcat" ]
spacy_streamlit . visualize ( models , default_text , visualizers )| دعوى | يكتب | وصف |
|---|---|---|
models | قائمة [str] / dict [str ، str] | أسماء نماذج Spacy القابلة للتحميل (مسارات أو أسماء الحزم). تصبح النماذج قابلة للاختيار من خلال القائمة المنسدلة. يمكن أن تكون إما قائمة بالأسماء أو الأسماء المعينة إلى أوصاف لعرضها في القائمة المنسدلة. |
default_text | شارع | النص الافتراضي للتحليل عند التحميل. الإعدادات الافتراضية إلى "" . |
default_model | اختياري [STR] | الاسم الاختياري للنموذج الافتراضي. إذا لم يتم تعيينه ، يتم استخدام النموذج الأول في قائمة models . |
visualizers | قائمة [str] | أسماء المرئيات لإظهار. الإعدادات الافتراضية لـ ["parser", "ner", "textcat", "similarity", "tokens"] . |
ner_labels | اختياري [قائمة [str]] | ملصقات ner لتشمل. إذا لم يتم تعيينه ، فسيتم استخدام جميع الملصقات الموجودة في مكون خط أنابيب "ner" . |
ner_attrs | قائمة [str] | سمات Span الموضحة في جدول الكيانات المسماة. انظر visualizer.py للحصول على الافتراضات. |
token_attrs | قائمة [str] | سمات الرمز المميز لإظهار في الرمز المميز. انظر visualizer.py للحصول على الافتراضات. |
similarity_texts | Tuple [str ، str] | النصوص الافتراضية للمقارنة في مرئي التشابه. الإعدادات الافتراضية لـ ("apple", "orange") . |
show_json_doc | بول | إظهار زر لتبديل تمثيل json Doc . الافتراضات إلى True . |
show_meta | بول | إظهار زر لتبديل meta.json من خط الأنابيب الحالي. الافتراضات إلى True . |
show_config | بول | إظهار زر لتبديل config.cfg من خط الأنابيب الحالي. الافتراضات إلى True . |
show_visualizer_select | بول | إظهار القائمة المنسدلة الشريط الجانبي لتحديد المرئيات لعرضها (استنادًا إلى المرئيات الممكّنة). الإعدادات الافتراضية إلى False . |
sidebar_title | اختياري [STR] | العنوان الموضح في الشريط الجانبي. الافتراضات إلى None . |
sidebar_description | اختياري [STR] | الوصف الموضح في الشريط الجانبي. يقبل النص الذي تم تنظيمه. |
show_logo | بول | أظهر شعار Spacy في الشريط الجانبي. الافتراضات إلى True . |
color | اختياري [STR] | التجريبي: اللون الأساسي لاستخدامه في بعض عناصر واجهة المستخدم الرئيسية ( None لتعطيل الاختراق). الإعدادات الافتراضية إلى "#09A3D5" . |
get_default_text | قابلة للاستدعاء [[لغة] ، str] | الاختياري القابل للاتصال الذي يأخذ كائن nlp الذي تم تحميله حاليًا ويعيد النص الافتراضي. يمكن استخدامها لتوفير النصوص الافتراضية الخاصة باللغة. إذا كانت الوظيفة تُرجع None ، فسيتم استخدام قيمة default_text ، إن وجدت. الافتراضات إلى None . |
visualize_parser تصور علامات التبعية وعلامات جزء الكلام باستخدام مرئيات displacy Spacy.
import spacy
from spacy_streamlit import visualize_parser
nlp = spacy . load ( "en_core_web_sm" )
doc = nlp ( "This is a text" )
visualize_parser ( doc )| دعوى | يكتب | وصف |
|---|---|---|
doc | Doc | كائن Doc Spacy لتصور. |
| الكلمة الرئيسية فقط | ||
title | اختياري [STR] | عنوان كتلة المرئيات. |
key | اختياري [STR] | المفتاح المستخدم للمكون الباقي لاختيار الملصقات. |
manual | بول | العلم الذي يدل على ما إذا كانت وسيطة DOC هي كائن DOC أو قائمة بالديكتات التي تحتوي على معلومات تحليل. |
displacy_options | اختياري [DICT] | قاموس الخيارات التي سيتم نقلها إلى طريقة عرض الإزاحة لإنشاء HTML ليتم تقديمها. انظر: https://spacy.io/api/top-level#options-dep |
visualize_ner تصور الكيانات المسماة في Doc باستخدام SPACY's displacy Visualizer.
import spacy
from spacy_streamlit import visualize_ner
nlp = spacy . load ( "en_core_web_sm" )
doc = nlp ( "Sundar Pichai is the CEO of Google." )
visualize_ner ( doc , labels = nlp . get_pipe ( "ner" ). labels )| دعوى | يكتب | وصف |
|---|---|---|
doc | Doc | كائن Doc Spacy لتصور. |
| الكلمة الرئيسية فقط | ||
labels | التسلسل [str] | التسميات لإظهار في المنسدلة. |
attrs | قائمة [str] | سمات السبان للعرض في جدول الكيان. |
show_table | بول | سواء لإظهار جدول من الكيانات وسماتها. الافتراضات إلى True . |
title | اختياري [STR] | عنوان كتلة المرئيات. |
colors | DICT [str ، str] | يمتد قاموس الألوان للكيان لتصور ، مع مفاتيح كملصقات وألوان مقابلة كقيم. سيتم إهمال هذه الحجة قريبًا. في المستقبل ، يجب تمرير ARG COLORS في arg displacy_options مع "الألوان" المفتاح.) |
key | اختياري [STR] | المفتاح المستخدم للمكون الباقي لاختيار الملصقات. |
manual | بول | العلم الذي يدل على ما إذا كانت وسيطة DOC هي كائن DOC أو قائمة بالديكتات التي تحتوي على كيان تمتد |
| معلومة. | ||
displacy_options | اختياري [DICT] | قاموس الخيارات التي سيتم نقلها إلى طريقة عرض الإزاحة لإنشاء HTML ليتم تقديمها. انظر https://spacy.io/api/top-level#displacy_options-ent. |
visualize_spans تصور يمتد في Doc باستخدام SPACY's displacy Visualizer.
import spacy
from spacy_streamlit import visualize_spans
nlp = spacy . load ( "en_core_web_sm" )
doc = nlp ( "Sundar Pichai is the CEO of Google." )
span = doc [ 4 : 7 ] # CEO of Google
span . label_ = "CEO"
doc . spans [ "job_role" ] = [ span ]
visualize_spans ( doc , spans_key = "job_role" , displacy_options = { "colors" : { "CEO" : "#09a3d5" }})| دعوى | يكتب | وصف |
|---|---|---|
doc | Doc | كائن Doc Spacy لتصور. |
| الكلمة الرئيسية فقط | ||
spans_key | التسلسل [str] | الذي يمتد مفتاح تقديم الامتدادات من. الافتراضي هو "SC". |
attrs | قائمة [str] | السمات على امتداد الكيان المراد تصنيفها. يتم عرض السمات فقط عندما تكون وسيطة show_table صحيحة. |
show_table | بول | سواء لإظهار جدول من الفترات وسماتها. الافتراضات إلى True . |
title | اختياري [STR] | عنوان كتلة المرئيات. |
manual | بول | العلم الذي يدل على ما إذا كانت وسيطة DOC هي كائن DOC أو قائمة بالديكتات التي تحتوي على معلومات تمتد. |
displacy_options | اختياري [DICT] | قاموس الخيارات التي سيتم نقلها إلى طريقة عرض الإزاحة لإنشاء HTML ليتم تقديمها. انظر https://spacy.io/api/top-level#displacy_options-span. |
visualize_textcatتصور فئات النص التي تنبأ بها مصنف نص مدرب.
import spacy
from spacy_streamlit import visualize_textcat
nlp = spacy . load ( "./my_textcat_model" )
doc = nlp ( "This is a text about a topic" )
visualize_textcat ( doc )| دعوى | يكتب | وصف |
|---|---|---|
doc | Doc | كائن Doc Spacy لتصور. |
| الكلمة الرئيسية فقط | ||
title | اختياري [STR] | عنوان كتلة المرئيات. |
visualize_similarityتصور التشابه الدلالي باستخدام ناقلات كلمة النموذج. سيظهر تحذيرًا إذا لم تكن هناك متجهات في النموذج.
import spacy
from spacy_streamlit import visualize_similarity
nlp = spacy . load ( "en_core_web_lg" )
visualize_similarity ( nlp , ( "pizza" , "fries" ))| دعوى | يكتب | وصف |
|---|---|---|
nlp | Language | كائن nlp المحمّل مع المتجهات. |
default_texts | Tuple [str ، str] | النصوص الافتراضية للمقارنة على الحمل. الإعدادات الافتراضية لـ ("apple", "orange") . |
| الكلمة الرئيسية فقط | ||
threshold | يطفو | عتبة لما يعتبر "مشابهًا". إذا كانت درجة التشابه أكبر من العتبة ، تظهر النتيجة على أنها مماثلة. الافتراضات إلى 0.5 . |
title | اختياري [STR] | عنوان كتلة المرئيات. |
visualize_tokens تصور الرموز في Doc وسماتها.
import spacy
from spacy_streamlit import visualize_tokens
nlp = spacy . load ( "en_core_web_sm" )
doc = nlp ( "This is a text" )
visualize_tokens ( doc , attrs = [ "text" , "pos_" , "dep_" , "ent_type_" ])| دعوى | يكتب | وصف |
|---|---|---|
doc | Doc | كائن Doc Spacy لتصور. |
| الكلمة الرئيسية فقط | ||
attrs | قائمة [str] | أسماء سمات الرمز المميز للاستخدام. انظر visualizer.py للحصول على الافتراضات. |
title | اختياري [STR] | عنوان كتلة المرئيات. |
يحاول هؤلاء المساعدون ذاكرة التخزين المؤقت للنماذج المحملة وإنشاء كائنات Doc .
process_text معالجة نص مع نموذج لاسم معين وإنشاء كائن Doc . يدعو إلى مساعد load_model لتحميل النموذج.
import streamlit as st
from spacy_streamlit import process_text
spacy_model = st . sidebar . selectbox ( "Model name" , [ "en_core_web_sm" , "en_core_web_md" ])
text = st . text_area ( "Text to analyze" , "This is a text" )
doc = process_text ( spacy_model , text )| دعوى | يكتب | وصف |
|---|---|---|
model_name | شارع | اسم طراز Spacy قابل للتحميل. يمكن أن يكون اسم المسار أو الحزمة. |
text | شارع | النص للمعالجة. |
| عودة | Doc | الوثيقة المصنعة. |
load_model قم بتحميل نموذج Spacy من مسار أو حزمة مثبتة وإرجاع كائن nlp تم تحميله.
import streamlit as st
from spacy_streamlit import load_model
spacy_model = st . sidebar . selectbox ( "Model name" , [ "en_core_web_sm" , "en_core_web_md" ])
nlp = load_model ( spacy_model )| دعوى | يكتب | وصف |
|---|---|---|
name | شارع | اسم طراز Spacy قابل للتحميل. يمكن أن يكون اسم المسار أو الحزمة. |
| عودة | Language | كائن nlp المحمّل. |