PERPUSTAKAAN PENDUKUP PEMBARUAN MESIN FITUR & Seleksi Fitur & Seleksi untuk Model yang Dapat Dijelaskan: Kursus Kedua untuk Ilmuwan Data
Modul SNGRAMEXTRACTOR membantu mengekstrak hubungan sintaksis (tag SR) sebagai elemen-gram SN.
Kami mengikuti jalan yang ditandai oleh panah dalam dependensi dan mendapatkan sngram. [1]
Keuntungan dari n-gram sintaksis (SN-gram), yaitu, n-gram yang dibangun menggunakan jalur di pohon sintaksis, adalah bahwa mereka kurang sewenang-wenang daripada n-gram tradisional. Dengan demikian, jumlahnya kurang dari jumlah gram N tradisional. Selain itu, mereka dapat diartikan sebagai fenomena linguistik, sedangkan gram N tradisional tidak memiliki interpretasi linguistik yang masuk akal mereka hanyalah artefak statistik. [1]
SN-Gram memiliki kegunaan di banyak bidang aplikasi pemrosesan bahasa alami, seperti tugas klasifikasi dalam pembelajaran mesin [2], ekstraksi informasi [3], pemahaman kueri [4], terjemahan mesin [5], sistem penjawab pertanyaan [6]
Objek kamus dengan pasangan nilai kunci untuk bigram dan trigram berasal dari sn-gram.
from SNgramExtractor import SNgramExtractor
text = 'Economic news have little effect on financial markets.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
text = 'every cloud has a silver lining'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
nlp_french = spacy . load ( 'fr_core_news_sm' )
text = 'Je voudrais réserver un hôtel à Rennes.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = nlp_french )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ]) pip install SNgramExtractor
MD Azimul Haque (2022). Teknik & Seleksi Fitur untuk Model yang Dapat Diterjemahkan: Kursus Kedua untuk Ilmuwan Data. Lulu Press, Inc.