yoruba text
1.0.0
يحتوي هذا المستودع على نص Yorùbá الذي تم تربيته بالكامل ، تم تحويله إلى تنسيق تكوين نموذج تطبيع Unicode (NFC) ، حيث تتكون الأحرف المُرغى في حرف واحد مع الكود التالي:
def convert_to_NFC(filename, outfilename):
text=''.join(c for c in unicodedata.normalize('NFC', open(filename).read()))
with open(outfilename, 'w') as f:
f.write(text)
لقد أزعج النص الإذن بأغنية عبر الإنترنت مطلوبة عبر الإنترنت تم من خلالها الاستخدام في NLP و TTS و ASR Applications. ملاحظة ، قد يكون لبعض أخطاء الأحكام ، يرجى تقديم طلب سحب إذا كان لديك تصحيحات!
إذا كنت قد تمكنت من الاستشهاد بهذا الريبو في عملك ، يرجى استخدام:
@misc{Orife_yoruba-text_2018,
author = {Orife, Iroro and Fasubaa, Timilehin and Wahab, Olamilekan},
month = {1},
title = {{yoruba-text}},
url = {https://github.com/Niger-Volta-LTI/yoruba-text},
year = {2018}
}