SNgramExtractor
1.0.0
機器學習書籍庫圖書庫功能工程和可解釋模型的選擇:數據科學家的第二課程
SngrameXtractor模塊有助於提取句法關係(SR標籤)作為SN-Grams的元素。
我們遵循由依賴項中的箭頭標記的路徑並獲得sngrams。 [1]
使用句法樹中的路徑構建的句法n-gram(sn-gram)的優點是,它們不如傳統的n-grams任意。因此,它們的數量小於傳統n-gram的數量。此外,它們可以被解釋為語言現象,而傳統的n-grams沒有合理的語言解釋,它們僅僅是統計文物。 [1]
SN-Gram在許多自然語言處理應用領域中具有可用性,例如機器學習中的分類任務[2],信息提取[3],查詢理解[4],機器翻譯[5],問題答錄系統[6]
帶有Bigram和Trigram的鑰匙值對的字典對象和sn-gram得出的trigram。
from SNgramExtractor import SNgramExtractor
text = 'Economic news have little effect on financial markets.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
text = 'every cloud has a silver lining'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
nlp_french = spacy . load ( 'fr_core_news_sm' )
text = 'Je voudrais réserver un hôtel à Rennes.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = nlp_french )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ]) pip install SNgramExtractor
MD Azimul Haque(2022)。可解釋模型的功能工程和選擇:數據科學家的第二課程。 Lulu Press,Inc。