speech_dataset下载speech_dataset源代码下载

中文(简体)

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

首页>编程相关>Ai源码

speech_dataset

Ai源码

v0.1

下载

语音识别数据集

中国人

姓名	持续时间/h	地址	评论	应用
THCHS-30	30	https://openslr.org/18/
艾西尔	150	https://openslr.org/33/
ST-CMD	110	https://openslr.org/38/
Primewords	99	https://openslr.org/47/
艾滋病	200	https://openslr.org/62/
MagicData	755	https://openslr.org/68/
ASR＆SD	160	http://ncmmsc2021.org/competition2.html	如果有的话
aishell2	1000	http://www.aishelltech.com/aishell_2	如果有的话
塔·阿斯尔（Tal Asr）	100	https://ai.100tal.com/dataset
常见的声音	63	https://commonvoice.mozilla.org/zh-cn/datasets	普通语音语料库7.0
ASRU2019 ASR	500	https://www.datatang.com/competition	如果有的话
2021 SLT CSRC	398	https://www.data-baker.com/csrc_challenge.html	如果有的话
AIDATATANG_1505ZH	1505	https://datatang.com/opensource	如果有的话
wenetspeech	10000	https://github.com/wenet-e2e/wenetspeech
Kespeech	1542	https://openreview.net/forum?id=b3zoeq2sclq		语音识别，说话者验证，细分识别，语音转换
magicData-ramc	180	https://arxiv.org/pdf/2203.16844.pdf	从普通话的母语人士记录的对话性语音数据
普通话重音对话演讲语料库	58.78	https://magichub.com/datasets/mandarin-heavy-accent-conversational-spech-corpus/
免费的St中国普通话语料库	-	https://openslr.org/38/

英语

姓名	持续时间/h	地址	评论
常见的声音	2015	https://commonvoice.mozilla.org/zh-cn/datasets	普通语音语料库7.0
librispeech	960	https://openslr.org/12/
ST-AEDS-20180100	4.7	http://www.opensl.org/45/
TED-LIUM版本3	430	https://openslr.org/51/
多语言librispeech	44659	https://openslr.org/94/	有限的监督
Spgispeech	5000	https://datasets.kensho.com/datasets/scribe	如果有的话
语音命令	10	https://www.kaggle.com/c/tensorflow-speech-recognition-challenge/data
2020AESRC	160	https://datatang.com/interspeech2020	如果有的话
GigAspeech	10000	https://github.com/speechcolab/gigaspeech
人民的讲话	31400	https://openreview.net/pdf?id=r8cwidgj0yt
收入-21	39	https://arxiv.org/abs/2104.11348
voxpopuli	24100+543	https://arxiv.org/pdf/2101.00390.pdf	24100（未标记），543（转录）
CMU荒野多语言语音数据集	13	http://festvox.org/cmu_wilderness/	多种语言
MSR-86K	9795.46	https://huggingface.co/datasets/alex-song/msr-86k	多种语言

中文英语

姓名	持续时间/h	地址	评论
接缝	30	https://www.isca-speech.org/archive_v0/archive_papers/interspeech_2010/i10_1986.pdf
Tal Csasr	587	https://ai.100tal.com/dataset
ASRU2019 CSASR	200	https://www.datatang.com/competition	如果有的话
上升	10.62	https://arxiv.org/pdf/2112.06223.pdf

日语（JA-JP）

姓名	持续时间/h	地址	评论
常见的声音	26	https://commonvoice.mozilla.org/zh-cn/datasets	普通语音语料库7.0
日本_scripted_speech_corpus_daily_use_sentence	18	https://magichub.io/cn/datasets/japanese-scripted-speech-corpus-daily-use-sentence/
LaborotVspeech	2000	https://arxiv.org/pdf/2103.14736.pdf
CSJ	650	https://github.com/kaldi-asr/kaldi/tree/master/egs/csj
jtubespeech	1300	https://arxiv.org/pdf/2112.09323.pdf
MSR-86K	1779.03	https://huggingface.co/datasets/alex-song/msr-86k	多种语言

韩语（KO-KR）

姓名	持续时间/h	地址	评论
韩国录制的语音句子句子	4.3	https://magichub.io/cn/datasets/korean-scripted-speech-corpus-daily-use-sentence/
韩国转换语音corpus	5.22	https://magichub.io/cn/datasets/korean-corversational-spech-corpus/
MSR-86K	10338.66	https://huggingface.co/datasets/alex-song/msr-86k	多种语言

俄罗斯（ru-ru）

姓名	持续时间/h	地址	评论
常见的声音	148	https://commonvoice.mozilla.org/zh-cn/datasets	普通语音语料库7.0
Openstt	20000	https://arxiv.org/pdf/2006.08274.pdf	有限的监督
MSR-86K	3188.52	https://huggingface.co/datasets/alex-song/msr-86k	多种语言

法语（fr-fr）

姓名	持续时间/h	地址	评论
MediaPeech	10	https://arxiv.org/pdf/2103.16193.pdf	ASR系统评估数据集
MSR-86K	8316.70	https://huggingface.co/datasets/alex-song/msr-86k	多种语言

西班牙语（ES-ES）

姓名	持续时间/h	地址	评论
MediaPeech	10	https://arxiv.org/pdf/2103.16193.pdf	ASR系统评估数据集
MSR-86K	13976.84	https://huggingface.co/datasets/alex-song/msr-86k	多种语言

土耳其语（tr-tr）

姓名	持续时间/h	地址	评论
MediaPeech	10	https://arxiv.org/pdf/2103.16193.pdf	ASR系统评估数据集

阿拉伯语（AR）

姓名	持续时间/h	地址	评论
MediaPeech	10	https://arxiv.org/pdf/2103.16193.pdf	ASR系统评估数据集
MSR-86K	873.84	https://huggingface.co/datasets/alex-song/msr-86k	多种语言

噪音和非语言

姓名	持续时间/h	地址	评论
musan	-	https://opensl.org/17/
房间冲动响应和噪音数据库	-	https://opensl.org/28/
音频集	-	https://ieeexplore.ieee.org/document/7952261

语音综合数据集

中国人

姓名	持续时间/h	地址	评论
aishell3	85	https://openslr.org/93/
OPENCPOP	-	https://wenet.org.cn/opencpop/download/	唱歌声音综合

英语

姓名	持续时间/h	地址	评论
Hi-Fi多演讲者英语TTS数据集	291.6	https://opensl.org/109/
Libritts语料库	585	https://openslr.org/60/
Speechocean762	-	https://www.opensl.org/101/
Ryanspeech	10	http://mohammadmahoor.com/ryanspeech/

语音识别和说话者诊断的数据集

中国人

姓名	持续时间/h	地址	评论	应用
aishell4	120	https://openslr.org/111/	8通道，会议场景	语音识别，说话者诊断
ASR＆SD	160	http://ncmmsc2021.org/competition2.html	如果有的话	语音识别，说话者诊断
zhijiangcup	-	https://zhijiangcup.zhejianglab.com/zhijiang/match/details/id/6.html	如果有的话	语音识别，说话者诊断
M2MET	120	https://arxiv.org/pdf/2110.07393.pdf	8通道，会议场景	语音识别，说话者诊断

英语

姓名	持续时间/h	地址	评论	应用
Chime-6	-	https://chimechallenge.github.io/chime6/download.html	如果有的话	语音识别，说话者诊断

扬声器识别的数据集

中国人

姓名	持续时间/h	地址	评论	应用
CN-CELEB	-	https://opensl.org/82/
Kespeech	1542	https://openreview.net/forum?id=b3zoeq2sclq		语音识别，说话者验证，细分识别，语音转换
mtass	55.6	https://github.com/windstudent/complex-mtassnet
THCHS-30	40	http://www.opensl.org/18/

英语

姓名	持续时间/h	地址	评论
Voxceleb数据	-	http://www.robots.ox.ac.uk/~vgg/data/voxceleb/

语音活动检测数据集

法语

姓名	持续时间/h	地址	评论	应用
Inagvad	5	https://github.com/ina-foss/inagvad	10台电台和18个电视频道	语音活动检测，扬声器性别细分，性别监控

展开

附加信息

版本 v0.1
类型 Ai源码
更新时间 2025-08-22
大小 8.22KB
来自于 Github

相关应用

ears_dataset

2024-11-14
OpenCore_NO_ACPI_Build

2024-11-13
zkwork_aleo_gpu_worker

2024-11-11
glaucoma dataset metadata

2024-11-09
ffhq wrinkle dataset

2024-11-07
nextcloud_share_url_downloader

2024-11-01

为您推荐

chat.petals.dev

其他源码

1.0.0
GPT Prompt Templates

其他源码

1.0.0
GPTyped

其他源码

GPTyped 1.0.5
ML stack

Ai源码

1.0.0
awesome free chatgpt

Ai源码

1.0.0
pywin_contextmenu

Ai源码

Version update
Google Dorks

其他源码

1.0
shepherd

其他源码

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源码

v1.1.0-rc-3

相关资讯全部