Download cutlet - download do código -fonte cutlet

cutlet

Outro código-fonte

v0.3.0: Token-aligned romaji

Baixar

CLETLET

Corte de Irasutoya

O corte é uma ferramenta para converter japonês em Romaji. Confira a demonstração interativa! Veja também os documentos e a postagem original do blog.

Problema を英語で書く必要はありません。

Características:

Suporte para sistemas modificados de Hepburn, Kunreisiki, Nihonsiki
Substituições personalizadas para mapeamentos individuais
Substituições personalizadas para palavras específicas
Lista de exceções construídas (Tóquio, Osaka, etc.)
usa ortografia estrangeira quando disponível em unidic
Os substantivos adequados estão capitalizados
modo de lesma para geração de URL

Coisas não suportadas:

HEPBURN N-M: Shimbashi tradicional
macrons ou circunflexos: tōkyō, tôkyô
Passport Hepburn: Satoh (mas você pode usar uma exceção)
palavras hifenizadoras
Hepburn tradicional em geral não é apoiado

Internamente, o CTICLET usa Fugashi, para que você possa usar o mesmo dicionário que usa para tokenização normal.

Instalação

A costela pode ser instalada através do PIP, como de costume.

 pip install cutlet

Observe que, se você não tiver um dicionário de Mecab instalado, também precisará instalar um. Se você está apenas começando a unidade-lite, é uma boa escolha.

 pip install unidic-lite

Uso

Um script de linha de comando está incluído para testes rápidos. Basta usar cutlet e cada linha de stdin será tratada como uma frase. Você pode especificar o sistema para usar ( hepburn , kunrei , nippon ou nihon ) como o primeiro argumento.

 $ cutlet
ローマ字変換プログラム作ってみた。
Roma ji henkan program tsukutte mita.

No código:

 import cutlet
katsu = cutlet . Cutlet ()
katsu . romaji ( "カツカレーは美味しい" )
# => 'Cutlet curry wa oishii'

# you can print a slug suitable for urls
katsu . slug ( "カツカレーは美味しい" )
# => 'cutlet-curry-wa-oishii'

# You can disable using foreign spelling too
katsu . use_foreign_spelling = False
katsu . romaji ( "カツカレーは美味しい" )
# => 'Katsu karee wa oishii'

# kunreisiki, nihonsiki work too
katu = cutlet . Cutlet ( 'kunrei' )
katu . romaji ( "富士山" )
# => 'Huzi yama'

# comparison
nkatu = cutlet . Cutlet ( 'nihon' )

sent = "彼女は王への手紙を読み上げた。"
katsu . romaji ( sent )
# => 'Kanojo wa ou e no tegami wo yomiageta.'
katu . romaji ( sent )
# => 'Kanozyo wa ou e no tegami o yomiageta.'
nkatu . romaji ( sent )
# => 'Kanozyo ha ou he no tegami wo yomiageta.'

Alternativas

Kakasi: Historicamente importante, mas não atualizado desde 2014.
Pykakasi: A egoito, que faz segmentação por conta própria e usa seu próprio dicionário.
Kuroshiro: Javascript baseado.
Kana: Vá baseado.

Expandir

Informações adicionais

Versão v0.3.0: Token-aligned romaji
Tipo Outro código-fonte
Data da Última Atualização 2025-04-18
tamanho 403.43KB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos