speech_dataset
v0.1
中国人
| 姓名 | 持续时间/h | 地址 | 评论 | 应用 |
|---|---|---|---|---|
| THCHS-30 | 30 | https://openslr.org/18/ | ||
| 艾西尔 | 150 | https://openslr.org/33/ | ||
| ST-CMD | 110 | https://openslr.org/38/ | ||
| Primewords | 99 | https://openslr.org/47/ | ||
| 艾滋病 | 200 | https://openslr.org/62/ | ||
| MagicData | 755 | https://openslr.org/68/ | ||
| ASR&SD | 160 | http://ncmmsc2021.org/competition2.html | 如果有的话 | |
| aishell2 | 1000 | http://www.aishelltech.com/aishell_2 | 如果有的话 | |
| 塔·阿斯尔(Tal Asr) | 100 | https://ai.100tal.com/dataset | ||
| 常见的声音 | 63 | https://commonvoice.mozilla.org/zh-cn/datasets | 普通语音语料库7.0 | |
| ASRU2019 ASR | 500 | https://www.datatang.com/competition | 如果有的话 | |
| 2021 SLT CSRC | 398 | https://www.data-baker.com/csrc_challenge.html | 如果有的话 | |
| AIDATATANG_1505ZH | 1505 | https://datatang.com/opensource | 如果有的话 | |
| wenetspeech | 10000 | https://github.com/wenet-e2e/wenetspeech | ||
| Kespeech | 1542 | https://openreview.net/forum?id=b3zoeq2sclq | 语音识别,说话者验证,细分识别,语音转换 | |
| magicData-ramc | 180 | https://arxiv.org/pdf/2203.16844.pdf | 从普通话的母语人士记录的对话性语音数据 | |
| 普通话重音对话演讲语料库 | 58.78 | https://magichub.com/datasets/mandarin-heavy-accent-conversational-spech-corpus/ | ||
| 免费的St中国普通话语料库 | - | https://openslr.org/38/ |
英语
| 姓名 | 持续时间/h | 地址 | 评论 |
|---|---|---|---|
| 常见的声音 | 2015 | https://commonvoice.mozilla.org/zh-cn/datasets | 普通语音语料库7.0 |
| librispeech | 960 | https://openslr.org/12/ | |
| ST-AEDS-20180100 | 4.7 | http://www.opensl.org/45/ | |
| TED-LIUM版本3 | 430 | https://openslr.org/51/ | |
| 多语言librispeech | 44659 | https://openslr.org/94/ | 有限的监督 |
| Spgispeech | 5000 | https://datasets.kensho.com/datasets/scribe | 如果有的话 |
| 语音命令 | 10 | https://www.kaggle.com/c/tensorflow-speech-recognition-challenge/data | |
| 2020AESRC | 160 | https://datatang.com/interspeech2020 | 如果有的话 |
| GigAspeech | 10000 | https://github.com/speechcolab/gigaspeech | |
| 人民的讲话 | 31400 | https://openreview.net/pdf?id=r8cwidgj0yt | |
| 收入-21 | 39 | https://arxiv.org/abs/2104.11348 | |
| voxpopuli | 24100+543 | https://arxiv.org/pdf/2101.00390.pdf | 24100(未标记),543(转录) |
| CMU荒野多语言语音数据集 | 13 | http://festvox.org/cmu_wilderness/ | 多种语言 |
| MSR-86K | 9795.46 | https://huggingface.co/datasets/alex-song/msr-86k | 多种语言 |
中文英语
| 姓名 | 持续时间/h | 地址 | 评论 |
|---|---|---|---|
| 接缝 | 30 | https://www.isca-speech.org/archive_v0/archive_papers/interspeech_2010/i10_1986.pdf | |
| Tal Csasr | 587 | https://ai.100tal.com/dataset | |
| ASRU2019 CSASR | 200 | https://www.datatang.com/competition | 如果有的话 |
| 上升 | 10.62 | https://arxiv.org/pdf/2112.06223.pdf |
日语(JA-JP)
| 姓名 | 持续时间/h | 地址 | 评论 |
|---|---|---|---|
| 常见的声音 | 26 | https://commonvoice.mozilla.org/zh-cn/datasets | 普通语音语料库7.0 |
| 日本_scripted_speech_corpus_daily_use_sentence | 18 | https://magichub.io/cn/datasets/japanese-scripted-speech-corpus-daily-use-sentence/ | |
| LaborotVspeech | 2000 | https://arxiv.org/pdf/2103.14736.pdf | |
| CSJ | 650 | https://github.com/kaldi-asr/kaldi/tree/master/egs/csj | |
| jtubespeech | 1300 | https://arxiv.org/pdf/2112.09323.pdf | |
| MSR-86K | 1779.03 | https://huggingface.co/datasets/alex-song/msr-86k | 多种语言 |
韩语(KO-KR)
| 姓名 | 持续时间/h | 地址 | 评论 |
|---|---|---|---|
| 韩国录制的语音句子句子 | 4.3 | https://magichub.io/cn/datasets/korean-scripted-speech-corpus-daily-use-sentence/ | |
| 韩国转换语音corpus | 5.22 | https://magichub.io/cn/datasets/korean-corversational-spech-corpus/ | |
| MSR-86K | 10338.66 | https://huggingface.co/datasets/alex-song/msr-86k | 多种语言 |
俄罗斯(ru-ru)
| 姓名 | 持续时间/h | 地址 | 评论 |
|---|---|---|---|
| 常见的声音 | 148 | https://commonvoice.mozilla.org/zh-cn/datasets | 普通语音语料库7.0 |
| Openstt | 20000 | https://arxiv.org/pdf/2006.08274.pdf | 有限的监督 |
| MSR-86K | 3188.52 | https://huggingface.co/datasets/alex-song/msr-86k | 多种语言 |
法语(fr-fr)
| 姓名 | 持续时间/h | 地址 | 评论 |
|---|---|---|---|
| MediaPeech | 10 | https://arxiv.org/pdf/2103.16193.pdf | ASR系统评估数据集 |
| MSR-86K | 8316.70 | https://huggingface.co/datasets/alex-song/msr-86k | 多种语言 |
西班牙语(ES-ES)
| 姓名 | 持续时间/h | 地址 | 评论 |
|---|---|---|---|
| MediaPeech | 10 | https://arxiv.org/pdf/2103.16193.pdf | ASR系统评估数据集 |
| MSR-86K | 13976.84 | https://huggingface.co/datasets/alex-song/msr-86k | 多种语言 |
土耳其语(tr-tr)
| 姓名 | 持续时间/h | 地址 | 评论 |
|---|---|---|---|
| MediaPeech | 10 | https://arxiv.org/pdf/2103.16193.pdf | ASR系统评估数据集 |
阿拉伯语(AR)
| 姓名 | 持续时间/h | 地址 | 评论 |
|---|---|---|---|
| MediaPeech | 10 | https://arxiv.org/pdf/2103.16193.pdf | ASR系统评估数据集 |
| MSR-86K | 873.84 | https://huggingface.co/datasets/alex-song/msr-86k | 多种语言 |
噪音和非语言
| 姓名 | 持续时间/h | 地址 | 评论 |
|---|---|---|---|
| musan | - | https://opensl.org/17/ | |
| 房间冲动响应和噪音数据库 | - | https://opensl.org/28/ | |
| 音频集 | - | https://ieeexplore.ieee.org/document/7952261 |
中国人
| 姓名 | 持续时间/h | 地址 | 评论 |
|---|---|---|---|
| aishell3 | 85 | https://openslr.org/93/ | |
| OPENCPOP | - | https://wenet.org.cn/opencpop/download/ | 唱歌声音综合 |
英语
| 姓名 | 持续时间/h | 地址 | 评论 |
|---|---|---|---|
| Hi-Fi多演讲者英语TTS数据集 | 291.6 | https://opensl.org/109/ | |
| Libritts语料库 | 585 | https://openslr.org/60/ | |
| Speechocean762 | - | https://www.opensl.org/101/ | |
| Ryanspeech | 10 | http://mohammadmahoor.com/ryanspeech/ |
中国人
| 姓名 | 持续时间/h | 地址 | 评论 | 应用 |
|---|---|---|---|---|
| aishell4 | 120 | https://openslr.org/111/ | 8通道,会议场景 | 语音识别,说话者诊断 |
| ASR&SD | 160 | http://ncmmsc2021.org/competition2.html | 如果有的话 | 语音识别,说话者诊断 |
| zhijiangcup | - | https://zhijiangcup.zhejianglab.com/zhijiang/match/details/id/6.html | 如果有的话 | 语音识别,说话者诊断 |
| M2MET | 120 | https://arxiv.org/pdf/2110.07393.pdf | 8通道,会议场景 | 语音识别,说话者诊断 |
英语
| 姓名 | 持续时间/h | 地址 | 评论 | 应用 |
|---|---|---|---|---|
| Chime-6 | - | https://chimechallenge.github.io/chime6/download.html | 如果有的话 | 语音识别,说话者诊断 |
中国人
| 姓名 | 持续时间/h | 地址 | 评论 | 应用 |
|---|---|---|---|---|
| CN-CELEB | - | https://opensl.org/82/ | ||
| Kespeech | 1542 | https://openreview.net/forum?id=b3zoeq2sclq | 语音识别,说话者验证,细分识别,语音转换 | |
| mtass | 55.6 | https://github.com/windstudent/complex-mtassnet | ||
| THCHS-30 | 40 | http://www.opensl.org/18/ |
英语
| 姓名 | 持续时间/h | 地址 | 评论 |
|---|---|---|---|
| Voxceleb数据 | - | http://www.robots.ox.ac.uk/~vgg/data/voxceleb/ |
法语
| 姓名 | 持续时间/h | 地址 | 评论 | 应用 |
|---|---|---|---|---|
| Inagvad | 5 | https://github.com/ina-foss/inagvad | 10台电台和18个电视频道 | 语音活动检测,扬声器性别细分,性别监控 |