cutlet
v0.3.0: Token-aligned romaji

Cutlet은 일본어를 로마 지로 변환하는 도구입니다. 대화식 데모를 확인하십시오! 또한 문서와 원래 블로그 게시물을 참조하십시오.
문제 を英語で書く必要はありません。
특징:
지원되지 않는 것들 :
내부적으로 Cutlet은 Fugashi를 사용하므로 일반 토큰 화에 사용하는 것과 동일한 사전을 사용할 수 있습니다.
커틀릿은 평소와 같이 PIP를 통해 설치할 수 있습니다.
pip install cutlet
Mecab 사전이 설치되어 있지 않으면 설치해야합니다. 방금 시작한다면 Unidic-lite가 좋은 선택입니다.
pip install unidic-lite
빠른 테스트를 위해 명령 줄 스크립트가 포함되어 있습니다. cutlet 만 사용하면 각 줄의 줄은 문장으로 취급됩니다. 첫 번째 인수로 사용할 시스템 ( hepburn , kunrei , nippon 또는 nihon )을 지정할 수 있습니다.
$ cutlet
ローマ字変換プログラム作ってみた。
Roma ji henkan program tsukutte mita.
코드 :
import cutlet
katsu = cutlet . Cutlet ()
katsu . romaji ( "カツカレーは美味しい" )
# => 'Cutlet curry wa oishii'
# you can print a slug suitable for urls
katsu . slug ( "カツカレーは美味しい" )
# => 'cutlet-curry-wa-oishii'
# You can disable using foreign spelling too
katsu . use_foreign_spelling = False
katsu . romaji ( "カツカレーは美味しい" )
# => 'Katsu karee wa oishii'
# kunreisiki, nihonsiki work too
katu = cutlet . Cutlet ( 'kunrei' )
katu . romaji ( "富士山" )
# => 'Huzi yama'
# comparison
nkatu = cutlet . Cutlet ( 'nihon' )
sent = "彼女は王への手紙を読み上げた。"
katsu . romaji ( sent )
# => 'Kanojo wa ou e no tegami wo yomiageta.'
katu . romaji ( sent )
# => 'Kanozyo wa ou e no tegami o yomiageta.'
nkatu . romaji ( sent )
# => 'Kanozyo ha ou he no tegami wo yomiageta.'