mecab text cleaner
v0.1.1
這是一個簡單的Python軟件包,用於使用MeCab獲取日本讀數(Yomigana)和口音。另外,請考慮使用Pyopenjtalk(無重音)或Pyopenjtalk_g2p_prosody(ESPNET)(帶有重音),因為此軟件包不考慮複合詞的重音變化。
通過PIP或PIPX(或您喜歡的軟件包管理器)安裝此信息:
pipx install mecab-text-cleaner[unidecode,unidic]pip install mecab-text-cleaner[unidecode,unidic] > mtc いい天気ですね。
イ]ー テ]ンキ デス ネ。
> mtc いい天気ですね。 --ascii
i] te]nki desu ne.
> mtc いい天気ですね --no-add-atype --no-add-blank-between-words
イーテンキデスネ
> mtc いい天気ですね --no-add-atype --no-add-blank-between-words -r kana
イイテンキデスネ from mecab_text_cleaner import to_reading , to_ascii_clean
assert to_reading ( " 空、雲。 n雨!(" ) == "ソ]ラ、 ク]モ。 nア]メ!("
assert to_ascii_clean ( " 한空、雲。 n雨!(" ) == "han so]ra, ku]mo. n a]me!(" 謝謝這些好人(表情符號鑰匙):
該項目遵循全企業規範。歡迎任何形式的貢獻!