tagged wiki2019zhダウンロードtagged wiki2019zhソースコードのダウンロード

日本語

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

ホーム>プログラミング関連>AI ソースコード

tagged wiki2019zh

AI ソースコード

v1.0.0

ダウンロード

コーパスをダウンロードします

2019年の中国のwikiコーパスは、部分的な注釈を備えています

2019年の中国のwiki corpus wiki2019zh.zipに基づいて、hanlpのcoarse_electra_small_zhモデルが単語セグメンテーションに使用されました。

分詞の結果は、4タグBMESアノテーション方法を使用してシーケンスされ、形式は次のとおりです。

分詞のコーパスが次のと仮定します：你好Tom。我喜欢吃羊肉串。 、ラベルの結果は次のとおりです。

你 B
好 E
T B
o M
m E
。 S
SENTENCE END
我 S
喜 B
欢 E
吃 S
羊 B
肉 M
串 E
。 S
SENTENCE END
TEXT END

使用中は、埋め込みと句読点がどのように処理されるか、およびステートメントとコーパスの終了のためにSENTENCE ENDとTEXT ENDに注意を払う必要があるかもしれません。

分詞で使用されるスクリプトは、process_wiki_data.pyです。

このスクリプトを実行するには多くの時間がかかります。

CPUモデル：Intel Xeon（Cascade Lake）Platinum 8269cy
CPUメイン周波数：2.5GHz/3.2GHz
費やした時間：7日、11時間、2分

拡大する

追加情報

バージョン v1.0.0
タイプ AI ソースコード
更新時間 2025-09-11
サイズ 2.55KB
から Github

関連アプリ

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

おすすめ

chat.petals.dev

その他のソースコード

1.0.0
GPT Prompt Templates

その他のソースコード

1.0.0
GPTyped

その他のソースコード

GPTyped 1.0.5
ML stack

AI ソースコード

1.0.0
awesome free chatgpt

AI ソースコード

1.0.0
pywin_contextmenu

AI ソースコード

Version update
Google Dorks

その他のソースコード

1.0
shepherd

その他のソースコード

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

その他のソースコード

v1.1.0-rc-3

関連情報すべて