Biblioteca complementaria de la ingeniería y selección de características de libros de aprendizaje automático para modelos explicables: un segundo curso para científicos de datos
El módulo Sngramextractor ayuda a extraer relaciones sintácticas (etiquetas SR) como elementos de SN-Grams.
Seguimos la ruta marcada por las flechas en las dependencias y obtenemos sngrams. [1]
La ventaja de los n-gramos sintácticos (SN-gramos), es decir, n-gramos que se construyen usando caminos en árboles sintácticos, es que son menos arbitrarios que los n-gramos tradicionales. Por lo tanto, su número es menor que el número de n-gramos tradicionales. Además, pueden interpretarse como un fenómeno lingüístico, mientras que los N-Grams tradicionales no tienen una interpretación lingüística plausible, son simplemente artefactos estadísticos. [1]
SN-GRAM tiene usabilidad en muchas áreas de aplicación de procesamiento de lenguaje natural, como tareas de clasificación en el aprendizaje automático [2], extracción de información [3], comprensión de consultas [4], traducción automática [5], sistemas de respuesta de preguntas [6]
Objeto de diccionario con pares de valor clave para BigRam y Trigram derivado de SN-Gram.
from SNgramExtractor import SNgramExtractor
text = 'Economic news have little effect on financial markets.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
text = 'every cloud has a silver lining'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
nlp_french = spacy . load ( 'fr_core_news_sm' )
text = 'Je voudrais réserver un hôtel à Rennes.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = nlp_french )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ]) pip install SNgramExtractor
MD Azimul Haque (2022). Ingeniería y selección de características para modelos explicables: un segundo curso para científicos de datos. Lulu Press, Inc.