Speech Corpus Collection
1.0.0
此存储库是用于自动语音识别(ASR)和文本到语音(TTS)的语音语料库的集合。
VCTK
大约10.4GB。替代主机
librispeech
大规模(1000小时)读英文语音的语料库。
TEDLIUM版本2
TED-Lium语料库是由音频谈判及其转录在TED网站上提供的。作者已经准备好并过滤了这些数据,以训练声学模型,以参加2011年口语翻译的国际研讨会(Lium English/French SLT系统在SLT任务中达到了第一个排名)。
CMU北极数据库
这些数据库包括大约1150次话语,包括美国英语男性(BDL)和女性(SLT)扬声器以及其他重音扬声器。
世界英语圣经
世界英语圣经是1901年美国标准版本对现代英语的公共领域更新。它的文字和录音在这里可以自由地避免。但是,不幸的是,每个音频文件都与一章相匹配,而不是一节经文,因此在大多数情况下太长。 Kyubyong通过手动将他们切成薄片。您可以将它们放在他的Dropbox上。
南希·波克斯
2011年暴风雪挑战赛的南希语料库。该数据可自由地用于签署许可证的研究使用。
Yunchao他
微博