Chinese Word Segmentation in NLP -Download - Chinese Word Segmentation in NLP -Quellcode -Download

Chinese Word Segmentation in NLP

AI-Quellcode

1.0.0

Herunterladen

Chinesische Wortsegmentierung

Stand der Technik Chinesische Wortsegmentierung mit BI-LSTMS (JI MA, Kuzman Ganchev und David Weiss, EMNLP 2018)-(https://aclweb.org/anthology/d18-1529)

Kompatibilität

Python3.6.x, Tensorflow 1.12.0

Notizen

In diesem Projekt wurden vier chinesische Datensätze (AS, Cityu, MSR und PKU) verwendet, um das Deep -Learning -Modell für die Aufgabe der chinesischen Wortsegmentierungsaufgabe zu trainieren. Diese Datensätze können von: http://sighan.cs.uchicago.edu/bakeoff2005/ erhalten werden

Zum Training

Run: python3 train.py

input_file_path ist der Pfad, der keine chinesische Sequenz ohne Raum enthält.

Label_File_Path ist der Pfad, der die chinesischen Sequenzbezeichnungen im BIES -Format enthält.

Zur Vorverarbeitung

Run: python3 preprocess.py original_file_path input_file_path output_file_path

Original_File_Path ist die Datei, die die chinesische Sequenz enthält.

input_file_path ist der Pfad, um die chinesische No-Raum-Sequenz zu speichern.

Label_File_Path ist der Weg, um die chinesischen Sequenzbezeichnungen im Bies -Format zu speichern.

Für Vorhersage

Run: python3 predict.py input_path output_path resources_path

input_path ist die Datei, die die chinesische No-Raum-Sequenz enthält.

Output_Path ist der Pfad, um die Vorhersagen im BIES -Format zu speichern.

Ressourcen_Path ist der Weg zum gespeicherten Modell.

Das gespeicherte Modell und die Extras können von http://bit.ly/2pkgzbg heruntergeladen und im Ordner der Ressourcen platziert werden.

Zum Tor

Run: python3 score.py predicition_file gold_file

Prediction_file ist die Datei, die die Vorhersagen im BIES -Format aus dem vorherigen Schritt enthält.

Gold_file ist der Weg zur Golddatei im Bies -Format.

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ AI-Quellcode
Aktualisierungszeit 2025-09-08
Größe 145.52KB
Kommt von Github

Ähnliche Anwendungen

Wortsuche 800

2024-11-08
Wortsuche Worträtselspiel Neueste Version

2024-07-11
Word Trek Word Brain Streak-Spiel

2024-03-31
Word Surf Word Game kostenlose mobile Version

2023-12-14
Word Nut Worträtselspiele Neueste Version

2023-11-15
Offizielle Version des Projektquellcodes für chinesische DOS-Spiele (chinesische DOS-Spiele im Browser).

2022-11-01

Chinese Word Segmentation in NLP

Chinesische Wortsegmentierung

Kompatibilität

Notizen

Zum Training

Zur Vorverarbeitung

Für Vorhersage

Zum Tor

Wortsuche 800

Wortsuche Worträtselspiel Neueste Version

Word Trek Word Brain Streak-Spiel

Word Surf Word Game kostenlose mobile Version

Word Nut Worträtselspiele Neueste Version

Offizielle Version des Projektquellcodes für chinesische DOS-Spiele (chinesische DOS-Spiele im Browser).

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express