yoruba text
1.0.0
Dieses Repository enthält vollständig diakritisiertes Yorùbá -Text, das in das NFC -Format (Normalisierungsformular für Unicode -Normalisierungsformulare) umgewandelt wurde, bei dem dialisierte Zeichen mit dem folgenden Code in ein einzelnes Zeichen komponiert werden:
def convert_to_NFC(filename, outfilename):
text=''.join(c for c in unicodedata.normalize('NFC', open(filename).read()))
with open(outfilename, 'w') as f:
f.write(text)
Text hat sich mit der Erlaubnis gestört, dass ein Online -Song online online gesucht wurde, um in NLP, TTS, ASRALATIONALATIONEN zu verwenden. Beachten Sie, dass einige der Sätze möglicherweise Fehler haben. Bitte reichen Sie eine Pull-Request ein, wenn Sie Korrekturen haben!
Wenn Sie dieses Repo in Ihrer Arbeit zitieren, verwenden Sie bitte bitte:
@misc{Orife_yoruba-text_2018,
author = {Orife, Iroro and Fasubaa, Timilehin and Wahab, Olamilekan},
month = {1},
title = {{yoruba-text}},
url = {https://github.com/Niger-Volta-LTI/yoruba-text},
year = {2018}
}