cutlet
v0.3.0: Token-aligned romaji

Cutlet是將日語轉換為Romaji的工具。查看互動演示!另請參閱文檔和原始博客文章。
問題を英語で書く必要はありません。
特徵:
不支持的事情:
在內部,Cutlet使用Fugashi,因此您可以使用與普通令牌使用相同的詞典。
可以照常通過PIP安裝炸薯條。
pip install cutlet
請注意,如果您沒有安裝MeCab詞典,則還必須安裝一個。如果您剛剛開始,Unidic-Lite是一個不錯的選擇。
pip install unidic-lite
包括一個命令行腳本以進行快速測試。只需使用cutlet ,每行STDIN將被視為句子。您可以將使用的系統( hepburn , kunrei , nippon或nihon )指定為第一個參數。
$ cutlet
ローマ字変換プログラム作ってみた。
Roma ji henkan program tsukutte mita.
在代碼中:
import cutlet
katsu = cutlet . Cutlet ()
katsu . romaji ( "カツカレーは美味しい" )
# => 'Cutlet curry wa oishii'
# you can print a slug suitable for urls
katsu . slug ( "カツカレーは美味しい" )
# => 'cutlet-curry-wa-oishii'
# You can disable using foreign spelling too
katsu . use_foreign_spelling = False
katsu . romaji ( "カツカレーは美味しい" )
# => 'Katsu karee wa oishii'
# kunreisiki, nihonsiki work too
katu = cutlet . Cutlet ( 'kunrei' )
katu . romaji ( "富士山" )
# => 'Huzi yama'
# comparison
nkatu = cutlet . Cutlet ( 'nihon' )
sent = "彼女は王への手紙を読み上げた。"
katsu . romaji ( sent )
# => 'Kanojo wa ou e no tegami wo yomiageta.'
katu . romaji ( sent )
# => 'Kanozyo wa ou e no tegami o yomiageta.'
nkatu . romaji ( sent )
# => 'Kanozyo ha ou he no tegami wo yomiageta.'