Speech Corpus Collection
1.0.0
此存儲庫是用於自動語音識別(ASR)和文本到語音(TTS)的語音語料庫的集合。
VCTK
大約10.4GB。替代主機
librispeech
大規模(1000小時)讀英文語音的語料庫。
TEDLIUM版本2
TED-Lium語料庫是由音頻談判及其轉錄在TED網站上提供的。作者已經準備好並過濾了這些數據,以訓練聲學模型,以參加2011年口語翻譯的國際研討會(Lium English/French SLT系統在SLT任務中達到了第一個排名)。
CMU北極數據庫
這些數據庫包括大約1150次話語,包括美國英語男性(BDL)和女性(SLT)揚聲器以及其他重音揚聲器。
世界英語聖經
世界英語聖經是1901年美國標準版本對現代英語的公共領域更新。它的文字和錄音在這裡可以自由地避免。但是,不幸的是,每個音頻文件都與一章相匹配,而不是一節經文,因此在大多數情況下太長。 Kyubyong通過手動將他們切成薄片。您可以將它們放在他的Dropbox上。
南希·波克斯
2011年暴風雪挑戰賽的南希語料庫。該數據可自由地用於簽署許可證的研究使用。
Yunchao他
微博