Chinese Word Segmentation in NLP

Chinese Word Segmentation in NLP

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

การแบ่งส่วนคำภาษาจีน

การแบ่งส่วนคำภาษาจีนที่ทันสมัยกับ BI-LSTMS (Ji Ma, Kuzman Ganchev และ David Weiss, EMNLP 2018)-(https://aclweb.org/anthology/d18-1529)

ความเข้ากันได้

Python3.6.x, tensorflow 1.12.0

หมายเหตุ

ในโครงการนี้มีการใช้ชุดข้อมูลภาษาจีนสี่ชุด (AS, CityU, MSR และ PKU) เพื่อฝึกอบรมรูปแบบการเรียนรู้อย่างลึกซึ้งสำหรับงานการแบ่งส่วนคำภาษาจีน ชุดข้อมูลเหล่านี้สามารถรับได้จาก: http://sighan.cs.uchicago.edu/bakeoff2005/

สำหรับการฝึกอบรม

Run: python3 train.py

input_file_path เป็นเส้นทางที่มีลำดับภาษาจีนไม่มีพื้นที่

label_file_path เป็นเส้นทางที่มีฉลากลำดับจีนในรูปแบบ BIES

สำหรับการประมวลผลล่วงหน้า

Run: python3 preprocess.py original_file_path input_file_path output_file_path

Original_file_path เป็นไฟล์ที่มีลำดับภาษาจีน

input_file_path เป็นเส้นทางที่จะบันทึกลำดับภาษาจีนที่ไม่มีพื้นที่

label_file_path เป็นเส้นทางที่จะบันทึกฉลากลำดับภาษาจีนในรูปแบบ BIES

สำหรับการทำนาย

Run: python3 predict.py input_path output_path resources_path

input_path เป็นไฟล์ที่มีลำดับภาษาจีนไม่มีพื้นที่

Output_Path เป็นเส้นทางที่จะบันทึกการคาดการณ์ในรูปแบบ BIES

Resources_Path เป็นเส้นทางไปสู่โมเดลที่บันทึกไว้

โมเดลและความพิเศษที่บันทึกไว้สามารถดาวน์โหลดได้จาก http://bit.ly/2pkgzbg และวางไว้ในโฟลเดอร์ทรัพยากร

สำหรับการให้คะแนน

Run: python3 score.py predicition_file gold_file

Prediction_file เป็นไฟล์ที่มีการคาดการณ์ในรูปแบบ BIES จากขั้นตอนก่อนหน้า

Gold_File เป็นเส้นทางไปยังไฟล์ทองในรูปแบบ BIES

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-08
ขนาด 145.52KB
มาจาก Github

แอปที่เกี่ยวข้อง

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด

การแบ่งส่วนคำภาษาจีน

ความเข้ากันได้

หมายเหตุ

สำหรับการฝึกอบรม

สำหรับการประมวลผลล่วงหน้า

สำหรับการทำนาย

สำหรับการให้คะแนน

ค้นหาคำ 800

เกมค้นหาคำปริศนาคำศัพท์เวอร์ชันล่าสุด

Word Trek เกมแนวสมองคำ

Word Surf Word Game เวอร์ชันมือถือฟรี

เกม Word Nut Word Puzzle เวอร์ชันล่าสุด

เกม DOS ของจีน (เกม DOS ของจีนในเบราว์เซอร์) ซอร์สโค้ดโปรเจ็กต์เวอร์ชันอย่างเป็นทางการ

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express