yoruba text
1.0.0
Este repositório contém texto Yorùbá totalmente diacritizado, convertido em formato de composição de formulários de normalização unicode (NFC), onde caracteres diacritados são compostos em um único caractere com o seguinte código:
def convert_to_NFC(filename, outfilename):
text=''.join(c for c in unicodedata.normalize('NFC', open(filename).read()))
with open(outfilename, 'w') as f:
f.write(text)
O texto se incomodou com a permissão de uma música on -line online procurada com músicas on -line para uso na PNL, TTS, ASR Aplicações. Observe que algumas das sentenças podem ter erros, envia uma solicitação de tração se você tiver correções!
Se você tocar para citar este repositório em seu trabalho, use:
@misc{Orife_yoruba-text_2018,
author = {Orife, Iroro and Fasubaa, Timilehin and Wahab, Olamilekan},
month = {1},
title = {{yoruba-text}},
url = {https://github.com/Niger-Volta-LTI/yoruba-text},
year = {2018}
}