speech_dataset
v0.1
chinesisch
| Name | Dauer/h | Adresse | Bemerkung | Anwendung |
|---|---|---|---|---|
| Thchs-30 | 30 | https://openslr.org/18/ | ||
| Aishell | 150 | https://openslr.org/33/ | ||
| ST-CMDs | 110 | https://openslr.org/38/ | ||
| Ältereforwords | 99 | https://openslr.org/47/ | ||
| Aidatatang | 200 | https://openslr.org/62/ | ||
| MagicData | 755 | https://openslr.org/68/ | ||
| ASR & SD | 160 | http://ncmmsc2021.org/competition2.html | falls verfügbar | |
| Aishell2 | 1000 | http://www.aishelltech.com/aishell_2 | falls verfügbar | |
| Tal Asr | 100 | https://ai.100tal.com/dataset | ||
| Gemeinsame Stimme | 63 | https://commonvoice.mozilla.org/zh-cn/datasets | Common Voice Corpus 7.0 | |
| ASRU2019 ASR | 500 | https://www.datatang.com/competition | falls verfügbar | |
| 2021 SLT CSRC | 398 | https://www.data-baker.com/csrc_challenge.html | falls verfügbar | |
| Aidatatang_1505zh | 1505 | https://datatang.com/opensource | falls verfügbar | |
| Wenetspeech | 10000 | https://github.com/wenet-e2e/wenetspeech | ||
| Kespeech | 1542 | https://openreview.net/forum?id=b3zoeq2sclq | Spracherkennung, Sprecherüberprüfung, Identifizierung von Subdialekten, Sprachumwandlung | |
| MagicData-Ramc | 180 | https://arxiv.org/pdf/2203.16844.pdf | Konversationssprachdaten, die von Muttersprachlern von Mandarin Chinesisch aufgezeichnet wurden | |
| Mandarin schwerer Akzent -Gesprächsredenkorpus | 58.78 | https://magichub.com/datasets/mandarin-heavy-accent-converational-speech-corpus/ | ||
| Free ST Chinese Mandarin Corpus | - - | https://openslr.org/38/ |
Englisch
| Name | Dauer/h | Adresse | Bemerkung |
|---|---|---|---|
| Gemeinsame Stimme | 2015 | https://commonvoice.mozilla.org/zh-cn/datasets | Common Voice Corpus 7.0 |
| Librispeech | 960 | https://openslr.org/12/ | |
| ST-AEDS-20180100 | 4.7 | http://www.openslr.org/45/ | |
| TED-Lium Release 3 | 430 | https://openslr.org/51/ | |
| Mehrsprachiger Librispeech | 44659 | https://openslr.org/94/ | Begrenzte Aufsicht |
| Spgispeech | 5000 | https://datasets.kenho.com/datasets/Scribe | falls verfügbar |
| Sprachbefehle | 10 | https://www.kaggle.com/c/tensorflow-speech-recognition-chalenge/data | |
| 2020aesrc | 160 | https://datatang.com/interspeech2020 | falls verfügbar |
| Gigaspeech | 10000 | https://github.com/speechcolab/gigaspeech | |
| Die Rede des Volkes | 31400 | https://openreview.net/pdf?id=r8cwidgj0yt | |
| Einkommen-21 | 39 | https://arxiv.org/abs/2104.11348 | |
| Voxpopuli | 24100+543 | https://arxiv.org/pdf/2101.00390.pdf | 24100 (nicht beliebig), 543 (transkribiert) |
| CMU Wilderness Mehrsprachiger Sprachdatensatz | 13 | http://festvox.org/cmu_Wilderness/ | Mehrsprachig |
| MSR-86K | 9795.46 | https://huggingface.co/datasets/alex-song/msr-86k | Mehrsprachig |
Chinesisch-englisch
| Name | Dauer/h | Adresse | Bemerkung |
|---|---|---|---|
| Seame | 30 | https://www.iscaspeech.org/archive_v0/archive_papers/interspeech_2010/i10_1986.pdf | |
| Tal csasr | 587 | https://ai.100tal.com/dataset | |
| ASRU2019 CSASR | 200 | https://www.datatang.com/competition | falls verfügbar |
| AUFSTEIGEN | 10.62 | https://arxiv.org/pdf/2112.06223.pdf |
Japanisch (JA-JP)
| Name | Dauer/h | Adresse | Bemerkung |
|---|---|---|---|
| Gemeinsame Stimme | 26 | https://commonvoice.mozilla.org/zh-cn/datasets | Common Voice Corpus 7.0 |
| Japanisch_scriptted_speech_corpus_daily_use_sentence | 18 | https://magichub.io/cn/datasets/japanese-scriptted-speech-corpus-daily-use-ssence/ | |
| Laborotvspeech | 2000 | https://arxiv.org/pdf/2103.14736.pdf | |
| CSJ | 650 | https://github.com/kaldi-asr/kaldi/tree/master/egs/csj | |
| Jtubespeech | 1300 | https://arxiv.org/pdf/2112.09323.pdf | |
| MSR-86K | 1779.03 | https://huggingface.co/datasets/alex-song/msr-86k | Mehrsprachig |
Koreanisch (KO-Kr)
| Name | Dauer/h | Adresse | Bemerkung |
|---|---|---|---|
| Korean-scripted-Speech-Corpus-täglich-Nutzungs-Sentenz | 4.3 | https://magichub.io/cn/datasets/korean-scriptted-speech-corpus-daily-use-ssence/ | |
| Koreanische Konversationsrede-Corpus | 5.22 | https://magichub.io/cn/datasets/korean-conversational-speech-corpus/ | |
| MSR-86K | 10338.66 | https://huggingface.co/datasets/alex-song/msr-86k | Mehrsprachig |
Russisch (Ru-ru)
| Name | Dauer/h | Adresse | Bemerkung |
|---|---|---|---|
| Gemeinsame Stimme | 148 | https://commonvoice.mozilla.org/zh-cn/datasets | Common Voice Corpus 7.0 |
| Openstt | 20000 | https://arxiv.org/pdf/2006.08274.pdf | Begrenzte Aufsicht |
| MSR-86K | 3188.52 | https://huggingface.co/datasets/alex-song/msr-86k | Mehrsprachig |
Französisch (FR-FR)
| Name | Dauer/h | Adresse | Bemerkung |
|---|---|---|---|
| Mediaspeech | 10 | https://arxiv.org/pdf/2103.16193.pdf | ASR -Systembewertungsdatensatz |
| MSR-86K | 8316.70 | https://huggingface.co/datasets/alex-song/msr-86k | Mehrsprachig |
Spanisch (ES-ES)
| Name | Dauer/h | Adresse | Bemerkung |
|---|---|---|---|
| Mediaspeech | 10 | https://arxiv.org/pdf/2103.16193.pdf | ASR -Systembewertungsdatensatz |
| MSR-86K | 13976.84 | https://huggingface.co/datasets/alex-song/msr-86k | Mehrsprachig |
Türkisch (tr-tr)
| Name | Dauer/h | Adresse | Bemerkung |
|---|---|---|---|
| Mediaspeech | 10 | https://arxiv.org/pdf/2103.16193.pdf | ASR -Systembewertungsdatensatz |
Arabisch (AR)
| Name | Dauer/h | Adresse | Bemerkung |
|---|---|---|---|
| Mediaspeech | 10 | https://arxiv.org/pdf/2103.16193.pdf | ASR -Systembewertungsdatensatz |
| MSR-86K | 873.84 | https://huggingface.co/datasets/alex-song/msr-86k | Mehrsprachig |
Noise & Nonspeech
| Name | Dauer/h | Adresse | Bemerkung |
|---|---|---|---|
| Musan | - - | https://openslr.org/17/ | |
| Raum Impulsantwort und Rauschdatenbank | - - | https://openslr.org/28/ | |
| Audioset | - - | https://ieeexplore.ieee.org/document/7952261 |
chinesisch
| Name | Dauer/h | Adresse | Bemerkung |
|---|---|---|---|
| Aishell3 | 85 | https://openslr.org/93/ | |
| OpenCpop | - - | https://wenet.org.cn/opencpop/download/ | Singensynthese singen |
Englisch
| Name | Dauer/h | Adresse | Bemerkung |
|---|---|---|---|
| Hi-Fi-Multi-Sprecher-Englisch-TTS-Datensatz | 291.6 | https://openslr.org/109/ | |
| Libritts Corpus | 585 | https://openslr.org/60/ | |
| Realocean762 | - - | https://www.openslr.org/101/ | |
| Ryanspeech | 10 | http://mohammadmahoor.com/ryanspeech/ |
chinesisch
| Name | Dauer/h | Adresse | Bemerkung | Anwendung |
|---|---|---|---|---|
| Aishell4 | 120 | https://openslr.org/111/ | 8-Kanal, Konferenzszenarien | Spracherkennung, Sprecherdurchfallung |
| ASR & SD | 160 | http://ncmmsc2021.org/competition2.html | falls verfügbar | Spracherkennung, Sprecherdurchfallung |
| Zhijiangcup | - - | https://zhijiangcup.zhejianglab.com/zhijiang/match/details/id/6.html | falls verfügbar | Spracherkennung, Sprecherdurchfallung |
| M2met | 120 | https://arxiv.org/pdf/2110.07393.pdf | 8-Kanal, Konferenzszenarien | Spracherkennung, Sprecherdurchfallung |
Englisch
| Name | Dauer/h | Adresse | Bemerkung | Anwendung |
|---|---|---|---|---|
| Chime-6 | - - | https://chimechalenge.github.io/chime6/download.html | falls verfügbar | Spracherkennung, Sprecherdurchfallung |
chinesisch
| Name | Dauer/h | Adresse | Bemerkung | Anwendung |
|---|---|---|---|---|
| CN-Celeb | - - | https://openslr.org/82/ | ||
| Kespeech | 1542 | https://openreview.net/forum?id=b3zoeq2sclq | Spracherkennung, Sprecherüberprüfung, Identifizierung von Subdialekten, Sprachumwandlung | |
| Mtass | 55.6 | https://github.com/windstudent/complex-mtassnet | ||
| Thchs-30 | 40 | http://www.opensslr.org/18/ |
Englisch
| Name | Dauer/h | Adresse | Bemerkung |
|---|---|---|---|
| Voxceleb -Daten | - - | http://www.robots.ox.ac.uk/~vgg/data/voxceleb/ |
Französisch
| Name | Dauer/h | Adresse | Bemerkung | Anwendung |
|---|---|---|---|---|
| Inagvad | 5 | https://github.com/ina-foss/inagvad | 10 Radio- und 18 TV -Kanäle | Erkennung von Sprachaktivität, Sprecher -Geschlechtsgmentierung, Geschlechtsüberwachung |