مكتبة مصاحبة لمكتبة التعلم الآلي ميزات الهندسة واختيار النماذج القابلة للتفسير: دورة ثانية لعلماء البيانات
وحدة Sngramextractor تساعد في استخراج العلاقات النحوية (علامات SR) كعناصر من sn-grams.
نتبع المسار الذي يتميز به السهام في التبعيات ونحصل على sngrams. [1]
إن ميزة N-Grams النحوية (SN-Grams) ، أي n-grams التي تم إنشاؤها باستخدام مسارات في الأشجار النحوية ، هي أنها أقل تعسفية من n-grams التقليدية. وبالتالي ، فإن عددهم أقل من عدد n-grams التقليدية. علاوة على ذلك ، يمكن تفسيرها على أنها ظاهرة لغوية ، في حين أن n-grams التقليدية ليس لها تفسير لغوي معقول فهي مجرد قطعة أثرية إحصائية. [1]
يتمتع SN-GRAM بقدرة على الاستخدام عبر العديد من مجالات تطبيقات معالجة اللغة الطبيعية ، مثل مهام التصنيف في التعلم الآلي [2] ، استخراج المعلومات [3] ، فهم الاستعلام [4] ، الترجمة الآلية [5] ، أنظمة الإجابة على الأسئلة [6]
كائن القاموس مع أزواج القيمة الرئيسية لـ Bigram و Trigram المستمدة من SN-Gram.
from SNgramExtractor import SNgramExtractor
text = 'Economic news have little effect on financial markets.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
text = 'every cloud has a silver lining'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
nlp_french = spacy . load ( 'fr_core_news_sm' )
text = 'Je voudrais réserver un hôtel à Rennes.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = nlp_french )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ]) pip install SNgramExtractor
MD Azimul Haque (2022). ميزة هندسة واختيار النماذج القابلة للتفسير: دورة ثانية لعلماء البيانات. Lulu Press ، Inc.