mecab text cleaner下載 - mecab text cleaner源代碼下載

mecab text cleaner

Ai源碼

v0.1.1

下載

mecab文本清潔劑

這是一個簡單的Python軟件包，用於使用MeCab獲取日本讀數（Yomigana）和口音。另外，請考慮使用Pyopenjtalk（無重音）或Pyopenjtalk_g2p_prosody（ESPNET）（帶有重音），因為此軟件包不考慮複合詞的重音變化。

安裝

通過PIP或PIPX（或您喜歡的軟件包管理器）安裝此信息：

pipx install mecab-text-cleaner[unidecode,unidic]

pip install mecab-text-cleaner[unidecode,unidic]

用法

 > mtc いい天気ですね。
イ]ー テ]ンキ デス ネ。
> mtc いい天気ですね。 --ascii
i] te]nki desu ne.
> mtc いい天気ですね --no-add-atype --no-add-blank-between-words
イーテンキデスネ
> mtc いい天気ですね --no-add-atype --no-add-blank-between-words -r kana
イイテンキデスネ

 from mecab_text_cleaner import to_reading , to_ascii_clean

assert to_reading ( "     空、雲。 n雨！（" ) == "ソ]ラ、 ク]モ。 nア]メ！（"
assert to_ascii_clean ( "      한空、雲。 n雨！（" ) == "han so]ra, ku]mo. n a]me!("