تنزيل negspacy - تنزيل رمز المصدر negspacy

negspacy

شفرة المصدر الأخرى

Spacy 3.3 support

تنزيل

negspacy: نفي لسباسي

كائن خط أنابيب Spacy لإلغاء المفاهيم في النص. بناء على خوارزمية Negex.

NEGEX - خوارزمية بسيطة لتحديد النتائج والأمراض المنقولة في ملخصات التفريغ تشابمان ، بريدويل ، هانبري ، كوبر ، بوكانان https://doi.org/10.1006/jbin.2001.1029

ما الجديد

الإصدار 1.0 هو تحديث إصدار رئيسي يوفر الدعم لواجهة Spacy 3.0 الجديدة لإضافة مكونات خطوط الأنابيب. نتيجة لذلك ، لا يتوافق مع الإصدارات السابقة من negspacy.

إذا كان مشروعك يستخدم Spacy 2.3.5 أو قبل ذلك ، فستحتاج إلى استخدام الإصدار 0.1.9. انظر REDME المؤرشفة.

التثبيت والاستخدام

تثبيت المكتبة.

pip install negspacy

مكتبة الاستيراد وسباسي.

 import spacy
from negspacy . negation import Negex

تحميل نموذج لغة Spacy. أضف كائن خط أنابيب negspacy. التصفية على أنواع الكيانات اختيارية.

 nlp = spacy . load ( "en_core_web_sm" )
nlp . add_pipe ( "negex" , config = { "ent_types" :[ "PERSON" , "ORG" ]})

عرض النفي.

 doc = nlp ( "She does not like Steve Jobs but likes Apple products." )

for e in doc . ents :
	print ( e . text , e . _ . negex )

 Steve Jobs True
Apple False

النظر في الاقتران مع scispacy للعثور على مفاهيم UMLS في النص والعملية النفيات.

أنماط Negex

Pseudo_negations - عبارات هي مشغلات كاذبة أو نفيات غامضة أو سلبيات مزدوجة
Previding_negations - عبارات النفي التي تسبق كيان
refer_negations - عبارات النفي التي تتبع الكيان
الإنهاء - العبارات التي قطعت جملة في أجزاء ، لأغراض اكتشاف النفي (.EG ، "لكن")

مصطلحات

قم بتعيين TermSet للاستخدام ، يتم استخدام en_clinical بشكل افتراضي.

en = عبارات نص اللغة الإنجليزية العامة
en_clinical الافتراضي = يضيف عبارات خاصة بالمجال السريري إلى اللغة الإنجليزية العامة
en_clinical_sensitive = يضيف عبارات إضافية للمساعدة في استبعاد الكيانات التاريخية وربما غير ذات صلة

لتعيين:

 from negspacy . negation import Negex
from negspacy . termsets import termset

ts = termset ( "en" )

nlp = spacy . load ( "en_core_web_sm" )
nlp . add_pipe (
    "negex" ,
    config = {
        "neg_termset" : ts . get_patterns ()
    }
)

وظائف إضافية

تغيير الأنماط أو عرض الأنماط المستخدمة

استبدل جميع الأنماط بمجموعة خاصة بك

 nlp = spacy . load ( "en_core_web_sm" )
nlp . add_pipe (
    "negex" , 
    config = {
        "neg_termset" :{
            "pseudo_negations" : [ "might not" ],
            "preceding_negations" : [ "not" ],
            "following_negations" :[ "declined" ],
            "termination" : [ "but" , "however" ]
        }
    }
    )

أضف وإزالة الأنماط الفردية أثناء الطيران من المصطلحات المدمجة

 from negspacy . termsets import termset
ts = termset ( "en" )
ts . add_patterns ({
            "pseudo_negations" : [ "my favorite pattern" ],
            "termination" : [ "these are" , "great patterns" , "but" ],
            "preceding_negations" : [ "wow a negation" ],
            "following_negations" : [ "extra negation" ],
        })
#OR
ts . remove_patterns (
        {
            "termination" : [ "these are" , "great patterns" ],
            "pseudo_negations" : [ "my favorite pattern" ],
            "preceding_negations" : [ "denied" , "wow a negation" ],
            "following_negations" : [ "unlikely" , "extra negation" ],
        }
    )

عرض الأنماط المستخدمة

 from negspacy . termsets import termset
ts = termset ( "en_clinical" )
print ( ts . get_patterns ())

نفي في قطع الأسماء

اعتمادًا على نموذج التعرف على الكيان المسماة الذي تستخدمه ، قد يكون لديك نفي "مكثف معًا" مع الأسماء. على سبيل المثال:

 nlp = spacy . load ( "en_core_sci_sm" )
doc = nlp ( "There is no headache." )
for e in doc . ents :
    print ( e . text )

# no headache

هذا من شأنه أن يسبب خوارزمية Negex تفوت النفي السابق. لحساب ذلك ، يمكنك إضافة chunk_prefix :

 nlp = spacy . load ( "en_core_sci_sm" )
ts = termset ( "en_clinical" )
nlp . add_pipe (
    "negex" ,
    config = {
        "chunk_prefix" : [ "no" ],
    },
    last = True ,
)
doc = nlp ( "There is no headache." )
for e in doc . ents :
    print ( e . text , e . _ . negex )

# no headache True

المساهمة

المؤلفون

جينو بيزارو

رخصة

مكتبات أخرى

ظهرت هذه المكتبة في عالم Spacy. تحقق من ذلك للحصول على مكتبات وإلهام مفيدة أخرى.

إذا كنت تبحث عن كائن خط أنابيب Spacy لاستخراج القيم التي تتوافق مع الكيان المسمى (على سبيل المثال ، تواريخ الولادة أو أرقام الحساب أو نتائج المختبر) ، ألق نظرة على الاستخراج.

يوسع

معلومات إضافية

الإصدار Spacy 3.3 support
النوع شفرة المصدر الأخرى
وقت التحديث 2025-04-16
الحجم 200.96KB
من Github

تطبيقات ذات صلة

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل