AsoSoft TTS Speech Corpus for Central Kurdish
1.0.0
庫爾德語和相關資源(例如標籤)中的語音數據是NLP研究所需的最重要的語言資源之一,以及語音綜合和自動語音識別等應用。庫爾德語中心的語音數據是創建並收集到語音合成和自動語音識別中的。為了創建這個語料庫,已經記錄和轉錄21個小時的語音。該語料庫由30歲以上的女發言人和學士學位和10,979個判決組成。這些句子在工作室中記錄了四個月。可以下載用於研究和非商業用法的Asosoft語音語料庫的子集。語音語料庫的這一子集可用於中央庫爾德語音綜合和其他口頭語言處理應用程序。當前可用的數據集由大約01:02(一小時和兩分鐘)的522“文本,音頻”配對組成。文件:•.wav:wave文件記錄在22.05 kHz,16bit,mono•.txt:庫爾德語中的轉錄