Documentação completa: https://pycantonese.org
Pycantonese é uma biblioteca Python para lingüística cantonesa e processamento de linguagem natural (PNL). Recursos atualmente implementados (mais por vir!):
Para baixar e instalar a versão estável e mais recente:
$ pip install -upgrade pycantonese
Pronto para mais? Confira a página do QuickStart.
Se sua equipe desejar assistência profissional no uso de serviços de consultoria e treinamento freelancers e serviços de treinamento freelancers, tanto para grupos acadêmicos quanto comerciais. Envie um email para Jackson L. Lee.
Se você achou pycantonese útil e gostaria de oferecer apoio, comprar um café percorreria um longo caminho!
Pycantonese é de autoria e mantido por Jackson L. Lee.
Lee, Jackson L., Litong Chen, Charles Lam, Chaak Ming Lau e Tsz-Him Tsui. 2022. Pycantonese: Linguística Cantonesa e PNL em Python. Anais da 13ª Conferência de Recursos e Avaliação da Língua .
@inproceedings{lee-etal-2022-pycantonese,
title = "PyCantonese: Cantonese Linguistics and NLP in Python" ,
author = "Lee, Jackson L. and
Chen, Litong and
Lam, Charles and
Lau, Chaak Ming and
Tsui, Tsz-Him",
booktitle = "Proceedings of The 13th Language Resources and Evaluation Conference" ,
month = june,
year = "2022" ,
publisher = "European Language Resources Association" ,
language = "English" ,
} MIT Licença. Consulte LICENSE.txt no código -fonte do Github para obter detalhes.
O conjunto de dados HKCANCOR incluído no pycantonese é substancialmente modificado de sua fonte em termos de formato. O conjunto de dados original possui um CC por licença. Consulte pycantonese/data/hkcancor/README.md no código -fonte do Github para obter detalhes.
Os dados do Rime-Cantoneses (Release 2021.05.16) são incorporados ao pycantoneso para segmentação de palavras e conversão de caracteres para o jyutping. Esses dados possuem uma licença CC por 4.0. Consulte pycantonese/data/rime_cantonese/README.md no código -fonte do GitHub para obter detalhes.
O logotipo Pycantonese é o personagem chinês 粵 Significado cantonês, com design artístico de Albino.snowman (identificador do Instagram).
Recursos maravilhosos com uma licença permissiva que foi incorporada ao Pycantonese:
Indivíduos que contribuíram com solicitações de puxar, relatórios de bugs e outros feedback (em ordem alfabética de sobrenomes):
Por favor, consulte CHANGELOG.md .
O código mais recente em desenvolvimento está disponível no Github em Jacksonllee/Pycantonese. Para obter esta versão para recursos experimentais ou para desenvolvimento:
$ git clone https://github.com/jacksonllee/pycantonese.git
$ cd pycantonese
$ pip install -e " .[dev] "Para executar testes e verificações de estilo:
$ pytest
$ flake8 src tests
$ black --check src testsPara criar os arquivos do site de documentação:
$ python docs/source/build_docs.py