Сопутствующая библиотека книги машинного обучения Инженерия и выбор для объяснимых моделей: второй курс для ученых данных
Модуль sngramextractor помогает извлекать синтаксические отношения (теги SR) в качестве элементов SN-граммов.
Мы следуем по пути, отмеченному стрелками в зависимости и получаем SNGRAM. [1]
Преимущество синтаксических N-граммов (SN-граммы), т.е. N-граммы, которые построены с использованием путей в синтаксических деревьях, заключается в том, что они менее произвольны, чем традиционные N-граммы. Таким образом, их число меньше, чем количество традиционных N-граммов. Кроме того, их можно интерпретировать как лингвистическое явление, в то время как традиционные N-граммы не имеют правдоподобной лингвистической интерпретации, они являются просто статистическим артефактом. [1]
SN-Gram имеет удобство использования во многих областях применения применения естественного языка, таких как задачи классификации в машинном обучении [2], извлечение информации [3], понимание запросов [4], машинный перевод [5], системы ответа на вопросы [6]
Словажный объект с парами клавишных значений для биграма и триграммы, полученной из SN-Gram.
from SNgramExtractor import SNgramExtractor
text = 'Economic news have little effect on financial markets.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
text = 'every cloud has a silver lining'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
nlp_french = spacy . load ( 'fr_core_news_sm' )
text = 'Je voudrais réserver un hôtel à Rennes.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = nlp_french )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ]) pip install SNgramExtractor
MD Азимул Хак (2022). Функциональная инженерия и выбор для объяснимых моделей: второй курс для ученых данных. Lulu Press, Inc.