전체 문서 : https://pycantonese.org
Pycantonese는 광동어 언어학 및 자연 언어 처리 (NLP)를위한 파이썬 라이브러리입니다. 현재 구현 된 기능 (앞으로 더 많이!) :
STABLE의 가장 최근 버전을 다운로드하고 설치하려면 다음과 같습니다.
$ pip 설치 -업그레이드 pycantonese
더 많은 준비가 되셨습니까? QuickStart 페이지를 확인하십시오.
팀이 Pycantonese 사용에 대한 전문적인 지원을 원한다면, 프리랜서 컨설팅 및 교육 서비스는 학업 및 상업 그룹 모두에서 이용할 수 있습니다. Jackson L. Lee에게 이메일을 보내주십시오.
Pycantonese가 유용하고 지원을 제공하고 싶다면 커피를 사서 먼 길을 갈 것입니다!
Pycantonese는 Jackson L. Lee가 작성하고 유지 관리합니다.
Lee, Jackson L., Litong Chen, Charles Lam, Chaak Ming Lau 및 Tsz-Him Tsui. 2022. Pycantonese : 광동어 언어학 및 Python의 NLP. 13 번째 언어 리소스 및 평가 회의의 절차 .
@inproceedings{lee-etal-2022-pycantonese,
title = "PyCantonese: Cantonese Linguistics and NLP in Python" ,
author = "Lee, Jackson L. and
Chen, Litong and
Lam, Charles and
Lau, Chaak Ming and
Tsui, Tsz-Him",
booktitle = "Proceedings of The 13th Language Resources and Evaluation Conference" ,
month = june,
year = "2022" ,
publisher = "European Language Resources Association" ,
language = "English" ,
} MIT 라이센스. 자세한 내용은 Github 소스 코드의 LICENSE.txt 참조하십시오.
Pycantonese에 포함 된 Hkcancor 데이터 세트는 형식으로 소스에서 실질적으로 수정됩니다. 원래 데이터 세트에는 라이센스 별 CC가 있습니다. 자세한 내용은 Github 소스 코드의 pycantonese/data/hkcancor/README.md 참조하십시오.
Rime-Cantonese 데이터 (릴리스 2021.05.16)는 단어 세분화 및 문자 간 변환을 위해 Pycantonese에 통합됩니다. 이 데이터에는 4.0 라이센스의 CC가 있습니다. 자세한 내용은 Github 소스 코드의 pycantonese/data/rime_cantonese/README.md 참조하십시오.
Pycantonese 로고는 Albino.snowman (Instagram Handle)의 예술 디자인을 가진 광동어를 의미하는 중국어입니다.
Pycantonese에 통합 된 허용 라이센스가있는 훌륭한 리소스 :
풀 요청, 버그 보고서 및 기타 피드백에 기여한 개인 (알파벳 순서로) :
CHANGELOG.md 참조하십시오.
개발중인 최신 코드는 Jacksonllee/Pycantonese의 Github에서 제공됩니다. 실험 기능 또는 개발을 위해이 버전을 얻기 위해 :
$ git clone https://github.com/jacksonllee/pycantonese.git
$ cd pycantonese
$ pip install -e " .[dev] "테스트 및 스타일 체크를 실행하려면 :
$ pytest
$ flake8 src tests
$ black --check src tests문서 웹 사이트 파일을 작성하려면 :
$ python docs/source/build_docs.py