Documentation complète: https://pycantonese.org
Le pycantonais est une bibliothèque Python pour la linguistique cantonaise et le traitement du langage naturel (PNL). Caractéristiques actuellement implémentées (plus à venir!):
Pour télécharger et installer la version stable et la plus récente:
$ PIP INSTALLANT - PLYANTONESE DE MODIFICATION
Prêt pour plus? Consultez la page QuickStart.
Si votre équipe souhaite une assistance professionnelle dans l'utilisation du pyantonais, des services de conseil en freelance et de formation sont disponibles pour les groupes académiques et commerciaux. Veuillez envoyer un courriel à Jackson L. Lee.
Si vous avez trouvé le pyantonais utile et que vous souhaitez offrir un soutien, l'acheter un café irait très loin!
Pycantonais est rédigé et entretenu par Jackson L. Lee.
Lee, Jackson L., Litong Chen, Charles Lam, Chaak Ming Lau et Tsz-Him Tsui. 2022. Pycantonais: linguistique cantonaise et NLP à Python. Actes de la 13e conférence de ressources linguistiques et d'évaluation .
@inproceedings{lee-etal-2022-pycantonese,
title = "PyCantonese: Cantonese Linguistics and NLP in Python" ,
author = "Lee, Jackson L. and
Chen, Litong and
Lam, Charles and
Lau, Chaak Ming and
Tsui, Tsz-Him",
booktitle = "Proceedings of The 13th Language Resources and Evaluation Conference" ,
month = june,
year = "2022" ,
publisher = "European Language Resources Association" ,
language = "English" ,
} Licence MIT. Veuillez consulter LICENSE.txt dans le code source GitHub pour plus de détails.
L'ensemble de données HKCancor inclus dans les pycantonèse est considérablement modifié à partir de sa source en termes de format. L'ensemble de données d'origine a une licence CC par licence. Veuillez consulter pycantonese/data/hkcancor/README.md dans le code source github pour plus de détails.
Les données du rime-cantonais (version 2021.05.16) sont incorporées dans le pycantonais pour la segmentation des mots et la conversion des caractères à jyutping. Ces données ont une licence CC par 4.0. Veuillez consulter pycantonese/data/rime_cantonese/README.md dans le code source github pour plus de détails.
Le logo pycantonais est le caractère chinois 粵 signifiant cantonais, avec un design artistique d'Albino.Snowman (poignée Instagram).
Des ressources merveilleuses avec une licence permissive qui ont été incorporées dans le pycantonais:
Les personnes qui ont contribué les demandes de traction, les rapports de bogues et autres commentaires (par ordre alphabétique des noms de famille):
Veuillez consulter CHANGELOG.md .
Le dernier code en cours de développement est disponible sur GitHub chez Jacksonllee / Pycantonais. Pour obtenir cette version pour les fonctionnalités expérimentales ou pour le développement:
$ git clone https://github.com/jacksonllee/pycantonese.git
$ cd pycantonese
$ pip install -e " .[dev] "Pour exécuter des tests et des vérifications de style:
$ pytest
$ flake8 src tests
$ black --check src testsPour créer les fichiers du site Web de documentation:
$ python docs/source/build_docs.py