Begleitbibliothek des maschinellen Lernbuchs Feature Engineering & Auswahl für erklärbare Modelle: Ein zweiter Kurs für Datenwissenschaftler
Das SNGramextractor-Modul hilft bei der Extraktion von syntaktischen Beziehungen (SR-Tags) als Elemente von SN-Gramm.
Wir folgen dem von den Pfeilen in den Abhängigkeiten gekennzeichneten Pfad und erhalten SNGrams. [1]
Der Vorteil von syntaktischen N-Gramm (SN-Gramm), dh N-Gramm, die mit Pfaden in syntaktischen Bäumen konstruiert werden, ist, dass sie weniger willkürlich sind als herkömmliche N-Gramms. Somit ist ihre Zahl geringer als die Anzahl traditioneller N-Gramm. Außerdem können sie als sprachliches Phänomen interpretiert werden, während traditionelle N-Gramm keine plausible sprachliche Interpretation haben, die sie nur statistisch sind. [1]
SN-Gram verfügt über viele Anwendungsbereiche für natürliche Sprachverarbeitungsbereiche wie Klassifizierungsaufgaben in maschinellem Lernen [2], Informationsextraktion [3], Abfrageverständnis [4], maschinelle Übersetzung [5], Fragen Antwortsysteme [6]
Wörterbuchobjekt mit Schlüsselwertpaaren für Bigram und Trigramm, die von SN-Gram abgeleitet sind.
from SNgramExtractor import SNgramExtractor
text = 'Economic news have little effect on financial markets.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
text = 'every cloud has a silver lining'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
nlp_french = spacy . load ( 'fr_core_news_sm' )
text = 'Je voudrais réserver un hôtel à Rennes.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = nlp_french )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ]) pip install SNgramExtractor
Md Azimul Haque (2022). Feature Engineering & Selection für erklärbare Modelle: Ein zweiter Kurs für Datenwissenschaftler. Lulu Press, Inc.