Vollständige Dokumentation: https://pycantonese.org
Pycantonese ist eine Python -Bibliothek für die kantonesische Linguistik und die Verarbeitung natürlicher Sprache (NLP). Derzeit implementierte Funktionen (weitere kommen!):
Um die stabile, neueste Version herunterzuladen und zu installieren:
$ pip install -upgrade pycantonese
Bereit für mehr? Schauen Sie sich die QuickStart -Seite an.
Wenn Ihr Team professionelle Unterstützung bei der Verwendung von Pycantonese wünschen, stehen freiberufliche Beratungs- und Schulungsdienste sowohl für akademische als auch für kommerzielle Gruppen zur Verfügung. Bitte senden Sie eine E -Mail an Jackson L. Lee.
Wenn Sie pykantonesisches nützlich empfunden haben und Unterstützung anbieten möchten, würde der Kauf eines Kaffees einen langen Weg gehen!
Pycantonese wird von Jackson L. Lee verfasst und gepflegt.
Lee, Jackson L., Litong Chen, Charles Lam, Chaak Ming Lau und TSZ-Him Tsui. 2022. Pycantonesisch: Kantonesische Linguistik und NLP in Python. Verfahren der 13. Sprachressourcen- und Bewertungskonferenz .
@inproceedings{lee-etal-2022-pycantonese,
title = "PyCantonese: Cantonese Linguistics and NLP in Python" ,
author = "Lee, Jackson L. and
Chen, Litong and
Lam, Charles and
Lau, Chaak Ming and
Tsui, Tsz-Him",
booktitle = "Proceedings of The 13th Language Resources and Evaluation Conference" ,
month = june,
year = "2022" ,
publisher = "European Language Resources Association" ,
language = "English" ,
} MIT -Lizenz. Weitere Informationen finden Sie im GitHub -Quellcode LICENSE.txt im GitHub -Quellcode.
Der in Pycantonese enthaltene HKCancor -Datensatz wird in Bezug auf das Format im Wesentlichen aus seiner Quelle modifiziert. Der ursprüngliche Datensatz verfügt über einen CC nach Lizenz. Weitere Informationen finden Sie in pycantonese/data/hkcancor/README.md .
Die Rime-Cantonese-Daten (Release 2021.05.16) sind in Pycantonese zur Wortsegmentierung und zur Verschiebung von Charakteren aufgenommen. Diese Daten haben eine CC -lizenz um 4.0. Weitere Einzelheiten finden Sie pycantonese/data/rime_cantonese/README.md im GitHub -Quellcode.
Das Pycantonese -Logo ist der chinesische Charakter 粵, was kantonesisch ist, mit künstlerischem Design von Albino.snowman (Instagram -Handle).
Wunderbare Ressourcen mit einer zulässigen Lizenz, die in Pycantonese aufgenommen wurde:
Personen, die Pull -Anfragen, Fehlerberichte und anderes Feedback beigetragen haben (in alphabetischer Reihenfolge der Nachnamen):
Bitte beachten Sie CHANGELOG.md .
Der neueste Code in der Entwicklung ist auf Github unter JacksonLlee/Pycantonese verfügbar. Um diese Version für experimentelle Merkmale oder für die Entwicklung zu erhalten:
$ git clone https://github.com/jacksonllee/pycantonese.git
$ cd pycantonese
$ pip install -e " .[dev] "Tests und Styling -Checks ausführen:
$ pytest
$ flake8 src tests
$ black --check src testsSo erstellen Sie die Dokumentations -Website -Dateien:
$ python docs/source/build_docs.py