Полная документация: https://pycantonese.org
Pycantonese - это библиотека Python для кантонской лингвистики и обработки естественного языка (NLP). В настоящее время реализованные функции (подробнее!):
Чтобы загрузить и установить стабильную, самую последнюю версию:
$ pip install -обновление Pycantonese
Готовы к большему? Проверьте страницу QuickStart.
Если ваша команда понравится профессиональной помощи в использовании Pycantonese, Freelance Consulting and Surfess Services доступны как для академических, так и для коммерческих групп. Пожалуйста, напишите Джексону Л. Ли.
Если вы нашли Pycantonese полезным и хотели бы предложить поддержку, покупка мне кофе будет иметь большое значение!
Pycantonese создан и поддерживается Джексоном Л. Ли.
Ли, Джексон Л., Литонг Чен, Чарльз Лэм, Чаак Мин Лау и Цз-Хим Цуй. 2022. Pycantonese: кантонская лингвистика и NLP в Python. Материалы 13 -й языковой конференции и оценки .
@inproceedings{lee-etal-2022-pycantonese,
title = "PyCantonese: Cantonese Linguistics and NLP in Python" ,
author = "Lee, Jackson L. and
Chen, Litong and
Lam, Charles and
Lau, Chaak Ming and
Tsui, Tsz-Him",
booktitle = "Proceedings of The 13th Language Resources and Evaluation Conference" ,
month = june,
year = "2022" ,
publisher = "European Language Resources Association" ,
language = "English" ,
} MIT Лицензия. Пожалуйста, смотрите LICENSE.txt в исходном коде GitHub для получения подробной информации.
Набор данных HKCancor, включенный в Pycantonese, существенно изменен из его источника с точки зрения формата. Оригинальный набор данных имеет CC по лицензии. Пожалуйста, см. pycantonese/data/hkcancor/README.md в исходном коде GitHub для получения подробной информации.
Райные кантонские данные (выпуск 2021.05.16) включены в Pycantonese для сегментации слов и преобразования символов в джутпинга. Эти данные имеют лицензию CC на 4,0. Пожалуйста, смотрите pycantonese/data/rime_cantonese/README.md в исходном коде Github для получения подробной информации.
Логотип Pycantonese - это китайский символ 粵, означающий кантонский, с художественным дизайном Albino.snowman (Handle Instagram).
Замечательные ресурсы с разрешительной лицензией, которая была включена в Pycantonese:
Лица, которые внесли запросы на привлечение, отчеты об ошибках и другие отзывы (в алфавитном порядке фамилий):
Пожалуйста, смотрите CHANGELOG.md .
Последний разрабатывающий код доступен на GitHub в JacksonLlee/Pycantonese. Чтобы получить эту версию для экспериментальных функций или для разработки:
$ git clone https://github.com/jacksonllee/pycantonese.git
$ cd pycantonese
$ pip install -e " .[dev] "Чтобы запустить тесты и проверки стиля:
$ pytest
$ flake8 src tests
$ black --check src testsЧтобы создать файлы веб -сайта документации:
$ python docs/source/build_docs.py