mecab text cleaner
v0.1.1
นี่เป็นแพ็คเกจ Python ที่เรียบง่ายสำหรับการอ่านภาษาญี่ปุ่น (Yomigana) และเน้นเสียงโดยใช้ mecab โปรดพิจารณาใช้ pyopenjtalk (ไม่มีสำเนียง) หรือ pyopenjtalk_g2p_prosody (ESPNET) (พร้อมสำเนียง) เนื่องจากแพ็คเกจนี้ไม่ได้อธิบายถึงการเปลี่ยนแปลงสำเนียงคำผสม
ติดตั้งนี้ผ่าน PIP หรือ PIPX (หรือตัวจัดการแพ็คเกจที่คุณชื่นชอบ):
pipx install mecab-text-cleaner[unidecode,unidic]pip install mecab-text-cleaner[unidecode,unidic] > mtc いい天気ですね。
イ]ー テ]ンキ デス ネ。
> mtc いい天気ですね。 --ascii
i] te]nki desu ne.
> mtc いい天気ですね --no-add-atype --no-add-blank-between-words
イーテンキデスネ
> mtc いい天気ですね --no-add-atype --no-add-blank-between-words -r kana
イイテンキデスネ from mecab_text_cleaner import to_reading , to_ascii_clean
assert to_reading ( " 空、雲。 n雨!(" ) == "ソ]ラ、 ク]モ。 nア]メ!("
assert to_ascii_clean ( " 한空、雲。 n雨!(" ) == "han so]ra, ku]mo. n a]me!(" ขอบคุณไปหาคนที่ยอดเยี่ยมเหล่านี้ (คีย์อีโมจิ):
โครงการนี้เป็นไปตามข้อกำหนดทั้งหมดของผู้เข้าร่วม การมีส่วนร่วมทุกชนิดยินดีต้อนรับ!