yoruba text
1.0.0
該存儲庫包含完全突出的Yorùbá文本,轉換為Unicode歸一化形式組成(NFC)格式,其中,將數字化的字符組成為單個字符,具有以下代碼:
def convert_to_NFC(filename, outfilename):
text=''.join(c for c in unicodedata.normalize('NFC', open(filename).read()))
with open(outfilename, 'w') as f:
f.write(text)
文字限於在線歌曲在線歌曲的許可,該歌曲在線歌曲,用於在NLP,TTS,ASR應用中使用。請注意,某些句子可能有錯誤,如果您有更正,請提交抽籤重新要求!
如果您要在工作中引用此倉庫,請使用:
@misc{Orife_yoruba-text_2018,
author = {Orife, Iroro and Fasubaa, Timilehin and Wahab, Olamilekan},
month = {1},
title = {{yoruba-text}},
url = {https://github.com/Niger-Volta-LTI/yoruba-text},
year = {2018}
}