cutlet下载 - cutlet源代码下载

cutlet

其他源码

v0.3.0: Token-aligned romaji

下载

肉饼

Irasutoya的Cutlet

Cutlet是将日语转换为Romaji的工具。查看互动演示！另请参阅文档和原始博客文章。

问题を英语で书く必要はありません。

特征：

支持修改后的赫本，库里西基，nihonsiki Systems
自定义覆盖单个映射
自定义覆盖特定单词
内置异常列表（东京，大阪等）
在Unidic中使用时使用外国拼写
专有名词已大写
URL生成的slug模式

不支持的事情：

传统的赫本n-to-m：shimbashi
宏或绕行：tōkyō，tôkyô
护照赫本：Satoh（但是您可以使用例外）
连字词
通常不支持传统的赫本

在内部，Cutlet使用Fugashi，因此您可以使用与普通令牌使用相同的词典。

安装

可以照常通过PIP安装炸薯条。

 pip install cutlet

请注意，如果您没有安装MeCab词典，则还必须安装一个。如果您刚刚开始，Unidic-Lite是一个不错的选择。

 pip install unidic-lite

用法

包括一个命令行脚本以进行快速测试。只需使用cutlet ，每行STDIN将被视为句子。您可以将使用的系统（ hepburn ， kunrei ， nippon或nihon ）指定为第一个参数。

 $ cutlet
ローマ字変換プログラム作ってみた。
Roma ji henkan program tsukutte mita.

在代码中：

 import cutlet
katsu = cutlet . Cutlet ()
katsu . romaji ( "カツカレーは美味しい" )
# => 'Cutlet curry wa oishii'

# you can print a slug suitable for urls
katsu . slug ( "カツカレーは美味しい" )
# => 'cutlet-curry-wa-oishii'

# You can disable using foreign spelling too
katsu . use_foreign_spelling = False
katsu . romaji ( "カツカレーは美味しい" )
# => 'Katsu karee wa oishii'

# kunreisiki, nihonsiki work too
katu = cutlet . Cutlet ( 'kunrei' )
katu . romaji ( "富士山" )
# => 'Huzi yama'

# comparison
nkatu = cutlet . Cutlet ( 'nihon' )

sent = "彼女は王への手紙を読み上げた。"
katsu . romaji ( sent )
# => 'Kanojo wa ou e no tegami wo yomiageta.'
katu . romaji ( sent )
# => 'Kanozyo wa ou e no tegami o yomiageta.'
nkatu . romaji ( sent )
# => 'Kanozyo ha ou he no tegami wo yomiageta.'