
O corte é uma ferramenta para converter japonês em Romaji. Confira a demonstração interativa! Veja também os documentos e a postagem original do blog.
Problema を英語で書く必要はありません。
Características:
Coisas não suportadas:
Internamente, o CTICLET usa Fugashi, para que você possa usar o mesmo dicionário que usa para tokenização normal.
A costela pode ser instalada através do PIP, como de costume.
pip install cutlet
Observe que, se você não tiver um dicionário de Mecab instalado, também precisará instalar um. Se você está apenas começando a unidade-lite, é uma boa escolha.
pip install unidic-lite
Um script de linha de comando está incluído para testes rápidos. Basta usar cutlet e cada linha de stdin será tratada como uma frase. Você pode especificar o sistema para usar ( hepburn , kunrei , nippon ou nihon ) como o primeiro argumento.
$ cutlet
ローマ字変換プログラム作ってみた。
Roma ji henkan program tsukutte mita.
No código:
import cutlet
katsu = cutlet . Cutlet ()
katsu . romaji ( "カツカレーは美味しい" )
# => 'Cutlet curry wa oishii'
# you can print a slug suitable for urls
katsu . slug ( "カツカレーは美味しい" )
# => 'cutlet-curry-wa-oishii'
# You can disable using foreign spelling too
katsu . use_foreign_spelling = False
katsu . romaji ( "カツカレーは美味しい" )
# => 'Katsu karee wa oishii'
# kunreisiki, nihonsiki work too
katu = cutlet . Cutlet ( 'kunrei' )
katu . romaji ( "富士山" )
# => 'Huzi yama'
# comparison
nkatu = cutlet . Cutlet ( 'nihon' )
sent = "彼女は王への手紙を読み上げた。"
katsu . romaji ( sent )
# => 'Kanojo wa ou e no tegami wo yomiageta.'
katu . romaji ( sent )
# => 'Kanozyo wa ou e no tegami o yomiageta.'
nkatu . romaji ( sent )
# => 'Kanozyo ha ou he no tegami wo yomiageta.'