yoruba text
1.0.0
Ce référentiel contient du texte Yorùbá entièrement diacrite, converti en format de composition de formulaire de normalisation Unicode (NFC), où les caractères diactisés sont composés en un seul caractère avec le code suivant:
def convert_to_NFC(filename, outfilename):
text=''.join(c for c in unicodedata.normalize('NFC', open(filename).read()))
with open(outfilename, 'w') as f:
f.write(text)
Le texte a gêné avec l'autorisation qu'une chanson en ligne en ligne a recherché en ligne des chansons en ligne pour une utilisation dans NLP, TTS, ASR ApplyAtalations. Remarque, certaines des condamnations peuvent avoir des erreurs, veuillez soumettre une demande de traction si vous avez des corrections!
Si vous avez si vous avez cité ce dépôt dans votre travail, veuillez utiliser:
@misc{Orife_yoruba-text_2018,
author = {Orife, Iroro and Fasubaa, Timilehin and Wahab, Olamilekan},
month = {1},
title = {{yoruba-text}},
url = {https://github.com/Niger-Volta-LTI/yoruba-text},
year = {2018}
}