Compagnon Bibliothèque de caractéristiques d'apprentissage automatique Ingénierie et sélection pour les modèles explicables: un deuxième cours pour les scientifiques des données
Le module SngraMExtractor aide à extraire les relations syntaxiques (étiquettes SR) comme éléments des grammes SN.
Nous suivons le chemin marqué par les flèches dans les dépendances et obtenons des sngrams. [1]
L'avantage des N-grammes syntaxiques (grammes Sn), c'est-à-dire des n-grammes qui sont construits en utilisant des chemins dans les arbres syntaxiques, est qu'ils sont moins arbitraires que les grammes N traditionnels. Ainsi, leur nombre est inférieur au nombre de n-grammes traditionnels. En outre, ils peuvent être interprétés comme un phénomène linguistique, tandis que les N-grammes traditionnels n'ont pas d'interprétation linguistique plausible, ce ne sont que des artefacts statistiques. [1]
SN-Gram a une convivialité dans de nombreux domaines d'application de traitement du langage naturel, tels que les tâches de classification dans l'apprentissage automatique [2], l'extraction d'informations [3], la compréhension de la requête [4], la traduction automatique [5], les systèmes de réponse aux questions [6]
Objet de dictionnaire avec des paires de valeurs clés pour Bigram et Trigram dérivées de Sn-Gram.
from SNgramExtractor import SNgramExtractor
text = 'Economic news have little effect on financial markets.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
text = 'every cloud has a silver lining'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
nlp_french = spacy . load ( 'fr_core_news_sm' )
text = 'Je voudrais réserver un hôtel à Rennes.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = nlp_french )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ]) pip install SNgramExtractor
MD Azimul Haque (2022). Caractéristiques d'ingénierie et de sélection pour les modèles explicables: un deuxième cours pour les scientifiques des données. Lulu Press, Inc.