yoruba text
1.0.0
Repositori ini berisi teks Yorùbá yang sepenuhnya diakritisasi, dikonversi ke format komposisi bentuk normalisasi unicode (NFC), di mana karakter yang diakritasi disusun menjadi satu karakter dengan kode berikut:
def convert_to_NFC(filename, outfilename):
text=''.join(c for c in unicodedata.normalize('NFC', open(filename).read()))
with open(outfilename, 'w') as f:
f.write(text)
Teks telah diganggu dengan izin lagu online yang dicari secara online disongeng untuk digunakan di NLP, TTS, ASR Applyations. Catatan, beberapa kalimat mungkin memiliki kesalahan, silakan kirimkan permintaan tarik jika Anda memiliki koreksi!
Jika Anda bermain -main dengan repo ini dalam pekerjaan Anda, silakan gunakan:
@misc{Orife_yoruba-text_2018,
author = {Orife, Iroro and Fasubaa, Timilehin and Wahab, Olamilekan},
month = {1},
title = {{yoruba-text}},
url = {https://github.com/Niger-Volta-LTI/yoruba-text},
year = {2018}
}