cutletダウンロード - cutletソースコードのダウンロード

cutlet

その他のソースコード

v0.3.0: Token-aligned romaji

ダウンロード

カツレツ

イラストヤによるカツレット

カットレットは、日本人をロマジに変換するためのツールです。インタラクティブなデモをチェックしてください！また、ドキュメントと元のブログ投稿も参照してください。

問題を英語で書く必要はありません。

特徴：

修正されたHepburn、Kunreisiki、Nihonsiki Systemsのサポート
個々のマッピングのカスタムオーバーライド
特定の単語のカスタムオーバーライド
組み込みの例外リスト（東京、大阪など）
UNIDICで利用可能な場合、外国のスペルを使用します
固有名詞は大文字です
URL生成用のスラッグモード

サポートされていないもの：

伝統的なHepburn n-to-m：shimbashi
マクロンまたは回旋骨折：東京、王子
パスポートヘップバーン：佐藤（ただし、例外を使用できます）
ハイフネーティングの言葉
一般的に伝統的なヘップバーンはサポートされていません

内部的には、CutletはFugashiを使用するため、通常のトークン化に使用するのと同じ辞書を使用できます。

インストール

カットレットは、通常どおりPIPを介して取り付けることができます。

 pip install cutlet

MECAB辞書がインストールされていない場合は、インストールする必要があることに注意してください。あなたがちょうど始まっているなら、Unidic-Liteは良い選択です。

 pip install unidic-lite

使用法

クイックテストのためにコマンドラインスクリプトが含まれています。 cutletを使用するだけで、stdinの各ラインは文として扱われます。最初の引数として使用するシステム（ hepburn 、 kunrei 、 nippon 、またはnihon ）を指定できます。

 $ cutlet
ローマ字変換プログラム作ってみた。
Roma ji henkan program tsukutte mita.

コード：

 import cutlet
katsu = cutlet . Cutlet ()
katsu . romaji ( "カツカレーは美味しい" )
# => 'Cutlet curry wa oishii'

# you can print a slug suitable for urls
katsu . slug ( "カツカレーは美味しい" )
# => 'cutlet-curry-wa-oishii'

# You can disable using foreign spelling too
katsu . use_foreign_spelling = False
katsu . romaji ( "カツカレーは美味しい" )
# => 'Katsu karee wa oishii'

# kunreisiki, nihonsiki work too
katu = cutlet . Cutlet ( 'kunrei' )
katu . romaji ( "富士山" )
# => 'Huzi yama'

# comparison
nkatu = cutlet . Cutlet ( 'nihon' )

sent = "彼女は王への手紙を読み上げた。"
katsu . romaji ( sent )
# => 'Kanojo wa ou e no tegami wo yomiageta.'
katu . romaji ( sent )
# => 'Kanozyo wa ou e no tegami o yomiageta.'
nkatu . romaji ( sent )
# => 'Kanozyo ha ou he no tegami wo yomiageta.'