Dokumentasi Lengkap: https://pycantonese.org
Pycantonese adalah perpustakaan Python untuk linguistik Kanton dan pemrosesan bahasa alami (NLP). Fitur yang saat ini diimplementasikan (lebih lanjut yang akan datang!):
Untuk mengunduh dan menginstal versi stabil dan terbaru:
$ Pip Instal -Pycanton yang Diperbaiki
Siap untuk lebih banyak? Lihat halaman QuickStart.
Jika tim Anda ingin bantuan profesional dalam menggunakan Pycantonese, konsultasi lepas dan layanan pelatihan tersedia untuk kelompok akademik dan komersial. Silakan email Jackson L. Lee.
Jika Anda menemukan orang Pycanton bermanfaat dan ingin menawarkan dukungan, membelikan saya kopi akan sangat membantu!
Pycantonese ditulis dan dikelola oleh Jackson L. Lee.
Lee, Jackson L., Litong Chen, Charles Lam, Chaak Ming Lau, dan Tsz-Him Tsui. 2022. Pycantonese: Linguistik Kanton dan NLP di Python. Prosiding Konferensi Sumber Daya dan Evaluasi Bahasa ke -13 .
@inproceedings{lee-etal-2022-pycantonese,
title = "PyCantonese: Cantonese Linguistics and NLP in Python" ,
author = "Lee, Jackson L. and
Chen, Litong and
Lam, Charles and
Lau, Chaak Ming and
Tsui, Tsz-Him",
booktitle = "Proceedings of The 13th Language Resources and Evaluation Conference" ,
month = june,
year = "2022" ,
publisher = "European Language Resources Association" ,
language = "English" ,
} Lisensi MIT. Silakan lihat LICENSE.txt dalam kode sumber GitHub untuk detailnya.
Dataset HKCANCOR yang termasuk dalam Pycantonese secara substansial dimodifikasi dari sumbernya dalam hal format. Dataset asli memiliki CC berdasarkan lisensi. Silakan lihat pycantonese/data/hkcancor/README.md dalam kode sumber GitHub untuk detailnya.
Data Rime-Canton (rilis 2021.05.16) dimasukkan ke dalam Pycanton untuk segmentasi kata dan konversi karakter-ke-jyutping. Data ini memiliki lisensi CC dengan 4.0. Silakan lihat pycantonese/data/rime_cantonese/README.md dalam kode sumber github untuk detailnya.
Logo Pycanton adalah karakter Cina 粵 yang berarti Kanton, dengan desain artistik oleh albino.snowman (pegangan Instagram).
Sumber daya yang luar biasa dengan lisensi permisif yang telah dimasukkan ke dalam orang Pycanton:
Individu yang telah menyumbangkan permintaan tarik, laporan bug, dan umpan balik lainnya (dalam urutan abjad nama belakang):
Silakan lihat CHANGELOG.md .
Kode terbaru yang sedang dikembangkan tersedia di Github di Jacksonllee/Pycantonese. Untuk mendapatkan versi ini untuk fitur eksperimental atau untuk pengembangan:
$ git clone https://github.com/jacksonllee/pycantonese.git
$ cd pycantonese
$ pip install -e " .[dev] "Untuk menjalankan tes dan cek penataan:
$ pytest
$ flake8 src tests
$ black --check src testsUntuk membangun file situs web dokumentasi:
$ python docs/source/build_docs.py