cutlet
v0.3.0: Token-aligned romaji

Cutlet เป็นเครื่องมือในการแปลงภาษาญี่ปุ่นเป็น Romaji ตรวจสอบการสาธิตแบบโต้ตอบ! ดูเอกสารและโพสต์บล็อกต้นฉบับ
ออกを英語で書く必要はありません。
คุณสมบัติ:
สิ่งที่ไม่รองรับ:
ภายใน Cutlet ใช้ Fugashi เพื่อให้คุณสามารถใช้พจนานุกรมเดียวกับที่คุณใช้สำหรับ tokenization ปกติ
Cutlet สามารถติดตั้งผ่าน PIP ได้ตามปกติ
pip install cutlet
โปรดทราบว่าหากคุณไม่มีพจนานุกรม Mecab ที่ติดตั้งคุณจะต้องติดตั้งด้วย หากคุณเพิ่งเริ่มต้นใช้งาน Unidic-Lite เป็นตัวเลือกที่ดี
pip install unidic-lite
สคริปต์บรรทัดคำสั่งรวมอยู่ในการทดสอบอย่างรวดเร็ว เพียงแค่ใช้ cutlet และแต่ละบรรทัดของ stdin จะได้รับการปฏิบัติเป็นประโยค คุณสามารถระบุระบบที่จะใช้ ( hepburn , kunrei , nippon หรือ nihon ) เป็นอาร์กิวเมนต์แรก
$ cutlet
ローマ字変換プログラム作ってみた。
Roma ji henkan program tsukutte mita.
ในรหัส:
import cutlet
katsu = cutlet . Cutlet ()
katsu . romaji ( "カツカレーは美味しい" )
# => 'Cutlet curry wa oishii'
# you can print a slug suitable for urls
katsu . slug ( "カツカレーは美味しい" )
# => 'cutlet-curry-wa-oishii'
# You can disable using foreign spelling too
katsu . use_foreign_spelling = False
katsu . romaji ( "カツカレーは美味しい" )
# => 'Katsu karee wa oishii'
# kunreisiki, nihonsiki work too
katu = cutlet . Cutlet ( 'kunrei' )
katu . romaji ( "富士山" )
# => 'Huzi yama'
# comparison
nkatu = cutlet . Cutlet ( 'nihon' )
sent = "彼女は王への手紙を読み上げた。"
katsu . romaji ( sent )
# => 'Kanojo wa ou e no tegami wo yomiageta.'
katu . romaji ( sent )
# => 'Kanozyo wa ou e no tegami o yomiageta.'
nkatu . romaji ( sent )
# => 'Kanozyo ha ou he no tegami wo yomiageta.'