cutlet
v0.3.0: Token-aligned romaji

Cutlet是将日语转换为Romaji的工具。查看互动演示!另请参阅文档和原始博客文章。
问题を英语で书く必要はありません。
特征:
不支持的事情:
在内部,Cutlet使用Fugashi,因此您可以使用与普通令牌使用相同的词典。
可以照常通过PIP安装炸薯条。
pip install cutlet
请注意,如果您没有安装MeCab词典,则还必须安装一个。如果您刚刚开始,Unidic-Lite是一个不错的选择。
pip install unidic-lite
包括一个命令行脚本以进行快速测试。只需使用cutlet ,每行STDIN将被视为句子。您可以将使用的系统( hepburn , kunrei , nippon或nihon )指定为第一个参数。
$ cutlet
ローマ字変換プログラム作ってみた。
Roma ji henkan program tsukutte mita.
在代码中:
import cutlet
katsu = cutlet . Cutlet ()
katsu . romaji ( "カツカレーは美味しい" )
# => 'Cutlet curry wa oishii'
# you can print a slug suitable for urls
katsu . slug ( "カツカレーは美味しい" )
# => 'cutlet-curry-wa-oishii'
# You can disable using foreign spelling too
katsu . use_foreign_spelling = False
katsu . romaji ( "カツカレーは美味しい" )
# => 'Katsu karee wa oishii'
# kunreisiki, nihonsiki work too
katu = cutlet . Cutlet ( 'kunrei' )
katu . romaji ( "富士山" )
# => 'Huzi yama'
# comparison
nkatu = cutlet . Cutlet ( 'nihon' )
sent = "彼女は王への手紙を読み上げた。"
katsu . romaji ( sent )
# => 'Kanojo wa ou e no tegami wo yomiageta.'
katu . romaji ( sent )
# => 'Kanozyo wa ou e no tegami o yomiageta.'
nkatu . romaji ( sent )
# => 'Kanozyo ha ou he no tegami wo yomiageta.'