Biblioteca de Machine Learning Book Engineering & Seleção para modelos explicáveis: um segundo curso para cientistas de dados
O módulo SNGRameXtrator ajuda a extrair relações sintáticas (tags SR) como elementos dos gramas de SN.
Seguimos o caminho marcado pelas setas nas dependências e obtemos sngrams. [1]
A vantagem dos n-gramas sintáticos (gramas de SN), ou seja, n-gramas que são construídos usando caminhos em árvores sintáticas, é que elas são menos arbitrárias que os n-gramas tradicionais. Assim, seu número é menor que o número de n-gramas tradicionais. Além disso, eles podem ser interpretados como fenômenos linguísticos, enquanto os n-grams tradicionais não têm interpretação linguística plausível, são meramente artefatos estatísticos. [1]
O SN-Gram tem usabilidade em muitas áreas de aplicação de processamento de linguagem natural, como tarefas de classificação no aprendizado de máquina [2], extração de informações [3], compreensão da consulta [4], tradução da máquina [5], sistemas de resposta a perguntas [6]
Objeto de dicionário com pares de valor-chave para bigram e trigrama derivados de Sn-Gram.
from SNgramExtractor import SNgramExtractor
text = 'Economic news have little effect on financial markets.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
text = 'every cloud has a silver lining'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
nlp_french = spacy . load ( 'fr_core_news_sm' )
text = 'Je voudrais réserver un hôtel à Rennes.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = nlp_french )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ]) pip install SNgramExtractor
Md azimul Haque (2022). Engenharia e seleção de recursos para modelos explicáveis: um segundo curso para cientistas de dados. Lulu Press, Inc.