mecab text cleaner
v0.1.1
이것은 일본어 판독 값 (Yomigana)과 Mecab을 사용하여 악센트를 얻기위한 간단한 파이썬 패키지입니다. 이 패키지는 복합 단어의 악센트 변화를 설명하지 않기 때문에 pyopenjtalk (악센트 없음) 또는 pyopenjtalk_g2p_prosody (ESPNET)를 사용해보십시오.
PIP 또는 PIPX (또는 좋아하는 패키지 관리자)를 통해이 정보를 설치하십시오.
pipx install mecab-text-cleaner[unidecode,unidic]pip install mecab-text-cleaner[unidecode,unidic] > mtc いい天気ですね。
イ]ー テ]ンキ デス ネ。
> mtc いい天気ですね。 --ascii
i] te]nki desu ne.
> mtc いい天気ですね --no-add-atype --no-add-blank-between-words
イーテンキデスネ
> mtc いい天気ですね --no-add-atype --no-add-blank-between-words -r kana
イイテンキデスネ from mecab_text_cleaner import to_reading , to_ascii_clean
assert to_reading ( " 空、雲。 n雨!(" ) == "ソ]ラ、 ク]モ。 nア]メ!("
assert to_ascii_clean ( " 한空、雲。 n雨!(" ) == "han so]ra, ku]mo. n a]me!(" 이 멋진 사람들 (이모티콘 키)에게 감사합니다.
이 프로젝트는 All-Contritors 사양을 따릅니다. 모든 종류의 공헌을 환영합니다!