Documentación completa: https://pycantonese.org
Picantonese es una biblioteca de Python para lingüística cantonesa y procesamiento de lenguaje natural (PNL). Características implementadas actualmente (¡más por venir!):
Para descargar e instalar la versión estable más reciente:
$ Pip Install -Upgrade Pycantonese
¿Listo para más? Consulte la página QuickStart.
Si su equipo desea asistencia profesional para usar Picantonese, los servicios de consultoría y capacitación independiente están disponibles para grupos académicos y comerciales. Envíe un correo electrónico a Jackson L. Lee.
Si ha encontrado que Pycantonese es útil y le gustaría ofrecerle apoyo, ¡comprarme un café sería muy útil!
Pycantonese es escrito y mantenido por Jackson L. Lee.
Lee, Jackson L., Litong Chen, Charles Lam, Chaak Ming Lau y Tsz-Him Tsui. 2022. Picantonesa: Lingüística cantonesa y PNL en Python. Actas de la 13ª Conferencia de Recursos y Evaluación del Lenguaje .
@inproceedings{lee-etal-2022-pycantonese,
title = "PyCantonese: Cantonese Linguistics and NLP in Python" ,
author = "Lee, Jackson L. and
Chen, Litong and
Lam, Charles and
Lau, Chaak Ming and
Tsui, Tsz-Him",
booktitle = "Proceedings of The 13th Language Resources and Evaluation Conference" ,
month = june,
year = "2022" ,
publisher = "European Language Resources Association" ,
language = "English" ,
} Licencia MIT. Consulte LICENSE.txt en el código fuente de GitHub para obtener más detalles.
El conjunto de datos HKCancor incluido en Pycantonese se modifica sustancialmente a partir de su fuente en términos de formato. El conjunto de datos original tiene un CC por licencia. Consulte pycantonese/data/hkcancor/README.md en el código fuente de GitHub para obtener más detalles.
Los datos de Rime-Cantonese (lanzamiento 2021.05.16) se incorporan a Picantonese para la segmentación de palabras y la conversión de caracteres a juzgando. Estos datos tienen una licencia CC por 4.0. Consulte pycantonese/data/rime_cantonese/README.md en el código fuente de GitHub para obtener más detalles.
El logotipo de Picantonese es el personaje chino 粵 que significa cantonés, con diseño artístico de Albino.Snowman (Handle de Instagram).
Recursos maravillosos con una licencia permisiva que se ha incorporado a Pycantonese:
Las personas que han contribuido con solicitudes de extracción, informes de errores y otros comentarios (en orden alfabético de apellidos):
Consulte CHANGELOG.md .
El último código en desarrollo está disponible en GitHub en Jacksonllee/Pycantonese. Para obtener esta versión para características experimentales o para el desarrollo:
$ git clone https://github.com/jacksonllee/pycantonese.git
$ cd pycantonese
$ pip install -e " .[dev] "Para ejecutar pruebas y cheques de estilo:
$ pytest
$ flake8 src tests
$ black --check src testsPara crear los archivos del sitio web de documentación:
$ python docs/source/build_docs.py