yoruba text
1.0.0
Этот репозиторий содержит полностью диакритизированный текст йоруба, преобразованный в формат композиции формы нормализации Unicode (NFC), где диаграммированные символы составляются в один символ со следующим кодом:
def convert_to_NFC(filename, outfilename):
text=''.join(c for c in unicodedata.normalize('NFC', open(filename).read()))
with open(outfilename, 'w') as f:
f.write(text)
Текст обеспокоен с разрешением, которую онлайн -песня онлайн искала онлайн -песни для использования в NLP, TTS, ASR Applications. Обратите внимание, что некоторые из приговоров могут иметь ошибки, пожалуйста, отправляйте запрос, если у вас есть исправления!
Если вы подсказываете этот репо в своей работе, пожалуйста, используйте:
@misc{Orife_yoruba-text_2018,
author = {Orife, Iroro and Fasubaa, Timilehin and Wahab, Olamilekan},
month = {1},
title = {{yoruba-text}},
url = {https://github.com/Niger-Volta-LTI/yoruba-text},
year = {2018}
}