ห้องสมุดเพื่อนร่วมงานของเครื่องเรียนรู้คุณสมบัติด้านวิศวกรรมและการเลือกสำหรับแบบจำลองที่อธิบายได้: หลักสูตรที่สองสำหรับนักวิทยาศาสตร์ด้านข้อมูล
โมดูล SNGRAMEXTRACTOR ช่วยแยกความสัมพันธ์ทางไวยากรณ์ (SR TAGs) เป็นองค์ประกอบของ SN-GRAMS
เราทำตามเส้นทางที่ทำเครื่องหมายด้วยลูกศรในการพึ่งพาและรับ sngrams [1]
ข้อได้เปรียบของ Syntactic N-GRAMs (SN-GRAMS) คือ N-GRAM ที่สร้างขึ้นโดยใช้เส้นทางในต้นไม้วากยสัมพันธ์คือพวกเขามีความผิดปกติน้อยกว่า N-GRAM แบบดั้งเดิม ดังนั้นจำนวนของพวกเขาจึงน้อยกว่าจำนวน N-grams แบบดั้งเดิม นอกจากนี้พวกเขาสามารถตีความได้ว่าเป็นปรากฏการณ์ทางภาษาศาสตร์ในขณะที่ N-grams แบบดั้งเดิมไม่มีการตีความทางภาษาที่เป็นไปได้พวกเขาเป็นเพียงสิ่งประดิษฐ์ทางสถิติ [1]
SN-GRAM มีการใช้งานในพื้นที่การประมวลผลภาษาธรรมชาติหลายแห่งเช่นงานการจำแนกประเภทในการเรียนรู้ของเครื่อง [2], การสกัดข้อมูล [3], การทำความเข้าใจแบบสอบถาม [4], การแปลด้วยเครื่อง [5], ระบบตอบคำถาม [6]
วัตถุพจนานุกรมที่มีคู่ค่าคีย์สำหรับ Bigram และ Trigram ที่ได้มาจาก SN-Gram
from SNgramExtractor import SNgramExtractor
text = 'Economic news have little effect on financial markets.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
text = 'every cloud has a silver lining'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = None )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ])
print ( '-----------------------------------' )
nlp_french = spacy . load ( 'fr_core_news_sm' )
text = 'Je voudrais réserver un hôtel à Rennes.'
SNgram_obj = SNgramExtractor ( text , meta_tag = 'original' , trigram_flag = 'yes' , nlp_model = nlp_french )
output = SNgram_obj . get_SNgram ()
print ( text )
print ( 'SNGram bigram:' , output [ 'SNBigram' ])
print ( 'SNGram trigram:' , output [ 'SNTrigram' ]) pip install SNgramExtractor
Md Azimul Haque (2022) คุณลักษณะทางวิศวกรรมและการเลือกสำหรับแบบจำลองที่อธิบายได้: หลักสูตรที่สองสำหรับนักวิทยาศาสตร์ด้านข้อมูล Lulu Press, Inc.