الوثائق الكاملة: https://pycantonese.org
Pycantonese هي مكتبة Python لللغويات الكانتونية ومعالجة اللغة الطبيعية (NLP). الميزات التي تم تنفيذها حاليًا (المزيد في المستقبل!):
لتنزيل وتثبيت الإصدار الأكثر استقرارًا:
$ pip install -ترقية pycantonese
جاهز للمزيد؟ تحقق من صفحة QuickStart.
إذا كان فريقك يرغب في المساعدة المهنية في استخدام خدمات الاستشارات والتدريب المستقلة للبيكانتونية ، تتوفر خدمات التدريب المستقلة للمجموعات الأكاديمية والتجارية. يرجى إرسال بريد إلكتروني إلى Jackson L. Lee.
إذا كنت قد وجدت Pycantonese مفيدًا وترغب في تقديم الدعم ، فإن شراء قهوة سيقطع شوطًا طويلًا!
تم تأليف Pycantonese وصيانته بواسطة Jackson L. Lee.
Lee ، Jackson L. ، Litong Chen ، Charles Lam ، Chaak Ming Lau ، و Tsz-Him Tsui. 2022. Pycantonese: اللغويات الكانتونية و NLP في Python. وقائع مؤتمر الموارد والتقييم اللغوي الثالث عشر .
@inproceedings{lee-etal-2022-pycantonese,
title = "PyCantonese: Cantonese Linguistics and NLP in Python" ,
author = "Lee, Jackson L. and
Chen, Litong and
Lam, Charles and
Lau, Chaak Ming and
Tsui, Tsz-Him",
booktitle = "Proceedings of The 13th Language Resources and Evaluation Conference" ,
month = june,
year = "2022" ,
publisher = "European Language Resources Association" ,
language = "English" ,
} رخصة معهد ماساتشوستس للتكنولوجيا. يرجى الاطلاع على LICENSE.txt في رمز مصدر github للحصول على التفاصيل.
يتم تعديل مجموعة بيانات HKCancor المدرجة في Pycantonese بشكل كبير من مصدرها من حيث التنسيق. مجموعة البيانات الأصلية لديها CC حسب الترخيص. يرجى الاطلاع على pycantonese/data/hkcancor/README.md في رمز مصدر Github للحصول على التفاصيل.
تم دمج بيانات Rime-Cantonese (الإصدار 2021.05.16) في Pycantonese من أجل تجزئة الكلمات وتحويل الأحرف إلى Jyutping. تحتوي هذه البيانات على رخصة CC بمقدار 4.0. يرجى الاطلاع على pycantonese/data/rime_cantonese/README.md في رمز مصدر github للحصول على التفاصيل.
شعار Pycantonese هو الشخصية الصينية 粵 تعني الكانتونية ، مع تصميم فني من قبل Albino.snowman (مقبض Instagram).
موارد رائعة مع ترخيص متساهى تم دمجها في Pycantonese:
الأفراد الذين ساهموا في طلبات السحب ، وتقارير الأخطاء ، وغيرها من التعليقات (بالترتيب الأبجدي للأسماء الأخيرة):
يرجى الاطلاع على CHANGELOG.md .
يتوفر أحدث رمز قيد التطوير على Github في Jacksonlee/Pycantonese. للحصول على هذا الإصدار للميزات التجريبية أو للتطوير:
$ git clone https://github.com/jacksonllee/pycantonese.git
$ cd pycantonese
$ pip install -e " .[dev] "لتشغيل الاختبارات وشيكات التصميم:
$ pytest
$ flake8 src tests
$ black --check src testsلإنشاء ملفات موقع الوثائق:
$ python docs/source/build_docs.py