Chinese Word Segmentation in NLP - Chinese Word Segmentation in NLP

Chinese Word Segmentation in NLP

Kode Sumber AI

1.0.0

Unduh

Segmentasi Kata Cina

Negara Bagian Segmentasi Kata Cina dengan Bi-lstms (Ji Ma, Kuzman Ganchev dan David Weiss, EMNLP 2018)-(https://aclweb.org/anthology/d18-1529)

Kesesuaian

Python3.6.x, TensorFlow 1.12.0

Catatan

Dalam proyek ini, empat dataset Cina (AS, Cityu, MSR dan PKU) digunakan untuk melatih model pembelajaran yang mendalam untuk tugas segmentasi kata Cina. Kumpulan data ini dapat didapat dari: http://sighan.cs.uchicago.edu/bakeoff2005/

Untuk pelatihan

Run: python3 train.py

input_file_path adalah jalur yang berisi urutan tidak-ruang Cina.

label_file_path adalah jalur yang berisi label urutan Cina dalam format BIES.

Untuk preprocessing

Run: python3 preprocess.py original_file_path input_file_path output_file_path

original_file_path adalah file yang berisi urutan Cina.

input_file_path adalah jalur untuk menyimpan urutan Cina tanpa ruang.

label_file_path adalah jalur untuk menyimpan label urutan Cina dalam format BIES.

Untuk prediksi

Run: python3 predict.py input_path output_path resources_path

Input_path adalah file yang berisi urutan tidak-ruang Cina.

output_path adalah jalur untuk menyimpan prediksi dalam format BIES.

Resources_path adalah jalur menuju model yang disimpan.

Model dan ekstra yang disimpan dapat diunduh dari http://bit.ly/2pkgzbg dan ditempatkan di folder sumber daya.

Untuk mencetak

Run: python3 score.py predicition_file gold_file

Prediction_file adalah file yang berisi format predika dalam BIES dari langkah sebelumnya.

Gold_file adalah jalur ke file emas dalam format BIES.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-08
ukuran 145.52KB
Berasal dari Github

Aplikasi Terkait

Pencarian Kata 800

2024-11-08
Game Puzzle Kata Pencarian Kata Versi Terbaru

2024-07-11
Permainan coretan Word Trek Word Brain

2024-03-31
Word Surf Word Game versi seluler gratis

2023-12-14
Game Puzzle Kata Kacang Kata Versi Terbaru

2023-11-15
Game DOS Cina (game DOS Cina di browser) memproyeksikan kode sumber versi resmi

2022-11-01

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua