yoruba text
1.0.0
Este repositorio contiene texto de Yorùbá totalmente diacritizado, convertido en formato de composición de formulario de normalización unicode (NFC), donde los caracteres diacritizados se componen en un solo carácter con el siguiente código:
def convert_to_NFC(filename, outfilename):
text=''.join(c for c in unicodedata.normalize('NFC', open(filename).read()))
with open(outfilename, 'w') as f:
f.write(text)
El texto se ha molestado con el permiso, una canción en línea en línea buscó en línea canciones para su uso en NLP, TTS, ASR Aplicalations. Tenga en cuenta que algunas de las sentencias pueden tener errores, por favor presenten una solicitud de extracción si tiene correcciones.
Si se dirige a citar este repositorio en su trabajo, por favor use:
@misc{Orife_yoruba-text_2018,
author = {Orife, Iroro and Fasubaa, Timilehin and Wahab, Olamilekan},
month = {1},
title = {{yoruba-text}},
url = {https://github.com/Niger-Volta-LTI/yoruba-text},
year = {2018}
}