cutlet
v0.3.0: Token-aligned romaji

カットレットは、日本人をロマジに変換するためのツールです。インタラクティブなデモをチェックしてください!また、ドキュメントと元のブログ投稿も参照してください。
問題を英語で書く必要はありません。
特徴:
サポートされていないもの:
内部的には、CutletはFugashiを使用するため、通常のトークン化に使用するのと同じ辞書を使用できます。
カットレットは、通常どおりPIPを介して取り付けることができます。
pip install cutlet
MECAB辞書がインストールされていない場合は、インストールする必要があることに注意してください。あなたがちょうど始まっているなら、Unidic-Liteは良い選択です。
pip install unidic-lite
クイックテストのためにコマンドラインスクリプトが含まれています。 cutletを使用するだけで、stdinの各ラインは文として扱われます。最初の引数として使用するシステム( hepburn 、 kunrei 、 nippon 、またはnihon )を指定できます。
$ cutlet
ローマ字変換プログラム作ってみた。
Roma ji henkan program tsukutte mita.
コード:
import cutlet
katsu = cutlet . Cutlet ()
katsu . romaji ( "カツカレーは美味しい" )
# => 'Cutlet curry wa oishii'
# you can print a slug suitable for urls
katsu . slug ( "カツカレーは美味しい" )
# => 'cutlet-curry-wa-oishii'
# You can disable using foreign spelling too
katsu . use_foreign_spelling = False
katsu . romaji ( "カツカレーは美味しい" )
# => 'Katsu karee wa oishii'
# kunreisiki, nihonsiki work too
katu = cutlet . Cutlet ( 'kunrei' )
katu . romaji ( "富士山" )
# => 'Huzi yama'
# comparison
nkatu = cutlet . Cutlet ( 'nihon' )
sent = "彼女は王への手紙を読み上げた。"
katsu . romaji ( sent )
# => 'Kanojo wa ou e no tegami wo yomiageta.'
katu . romaji ( sent )
# => 'Kanozyo wa ou e no tegami o yomiageta.'
nkatu . romaji ( sent )
# => 'Kanozyo ha ou he no tegami wo yomiageta.'