SNgramExtractor
1.0.0
机器学习书籍库图书库功能工程和可解释模型的选择:数据科学家的第二课程
SngrameXtractor模块有助于提取句法关系(SR标签)作为SN-Grams的元素。
我们遵循由依赖项中的箭头标记的路径并获得sngrams。[1]
使用句法树中的路径构建的句法n-gram(sn-gram)的优点是,它们不如传统的n-grams任意。因此,它们的数量小于传统n-gram的数量。此外,它们可以被解释为语言现象,而传统的n-grams没有合理的语言解释,它们仅仅是统计文物。 [1]
SN-Gram在许多自然语言处理应用领域中具有可用性,例如机器学习中的分类任务[2],信息提取[3],查询理解[4],机器翻译[5],问题答录系统[6]
带有Bigram和Trigram的钥匙值对的字典对象和sn-gram得出的trigram。
from SNgramExtractor import SNgramExtractor
text = 'Economic news have little effect on financial markets.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
text = 'every cloud has a silver lining'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
nlp_french = spacy . load ( 'fr_core_news_sm' )
text = 'Je voudrais réserver un hôtel à Rennes.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = nlp_french )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ]) pip install SNgramExtractor
MD Azimul Haque(2022)。可解释模型的功能工程和选择:数据科学家的第二课程。 Lulu Press,Inc。