
Cutlet - это инструмент для преобразования японцев в ромаджи. Проверьте интерактивную демонстрацию! Также см. Документы и оригинальный пост в блоге.
выпуск を英語で書く必要はありません。
Функции:
Вещи не поддерживаются:
Внутренне, Cutlet использует Fugashi, поэтому вы можете использовать тот же словарь, который вы используете для нормальной токенизации.
Катлет может быть установлена через PIP, как обычно.
pip install cutlet
Обратите внимание, что если у вас нет установленного Mecab Dictionary, вам также придется установить один. Если вы только начинаете, Unidic-Lite-хороший выбор.
pip install unidic-lite
Сценарий командной строки включен для быстрого тестирования. Просто используйте cutlet , и каждая линия Stdin будет рассматриваться как предложение. Вы можете указать систему для использования ( hepburn , kunrei , nippon или nihon ) в качестве первого аргумента.
$ cutlet
ローマ字変換プログラム作ってみた。
Roma ji henkan program tsukutte mita.
В коде:
import cutlet
katsu = cutlet . Cutlet ()
katsu . romaji ( "カツカレーは美味しい" )
# => 'Cutlet curry wa oishii'
# you can print a slug suitable for urls
katsu . slug ( "カツカレーは美味しい" )
# => 'cutlet-curry-wa-oishii'
# You can disable using foreign spelling too
katsu . use_foreign_spelling = False
katsu . romaji ( "カツカレーは美味しい" )
# => 'Katsu karee wa oishii'
# kunreisiki, nihonsiki work too
katu = cutlet . Cutlet ( 'kunrei' )
katu . romaji ( "富士山" )
# => 'Huzi yama'
# comparison
nkatu = cutlet . Cutlet ( 'nihon' )
sent = "彼女は王への手紙を読み上げた。"
katsu . romaji ( sent )
# => 'Kanojo wa ou e no tegami wo yomiageta.'
katu . romaji ( sent )
# => 'Kanozyo wa ou e no tegami o yomiageta.'
nkatu . romaji ( sent )
# => 'Kanozyo ha ou he no tegami wo yomiageta.'