speech_dataset Download - speech_dataset Quellcode Download

Herunterladen

Der Datensatz der Spracherkennung

chinesisch

Name	Dauer/h	Adresse	Bemerkung	Anwendung
Thchs-30	30	https://openslr.org/18/
Aishell	150	https://openslr.org/33/
ST-CMDs	110	https://openslr.org/38/
Ältereforwords	99	https://openslr.org/47/
Aidatatang	200	https://openslr.org/62/
MagicData	755	https://openslr.org/68/
ASR & SD	160	http://ncmmsc2021.org/competition2.html	falls verfügbar
Aishell2	1000	http://www.aishelltech.com/aishell_2	falls verfügbar
Tal Asr	100	https://ai.100tal.com/dataset
Gemeinsame Stimme	63	https://commonvoice.mozilla.org/zh-cn/datasets	Common Voice Corpus 7.0
ASRU2019 ASR	500	https://www.datatang.com/competition	falls verfügbar
2021 SLT CSRC	398	https://www.data-baker.com/csrc_challenge.html	falls verfügbar
Aidatatang_1505zh	1505	https://datatang.com/opensource	falls verfügbar
Wenetspeech	10000	https://github.com/wenet-e2e/wenetspeech
Kespeech	1542	https://openreview.net/forum?id=b3zoeq2sclq		Spracherkennung, Sprecherüberprüfung, Identifizierung von Subdialekten, Sprachumwandlung
MagicData-Ramc	180	https://arxiv.org/pdf/2203.16844.pdf	Konversationssprachdaten, die von Muttersprachlern von Mandarin Chinesisch aufgezeichnet wurden
Mandarin schwerer Akzent -Gesprächsredenkorpus	58.78	https://magichub.com/datasets/mandarin-heavy-accent-converational-speech-corpus/
Free ST Chinese Mandarin Corpus	- -	https://openslr.org/38/

Englisch

Name	Dauer/h	Adresse	Bemerkung
Gemeinsame Stimme	2015	https://commonvoice.mozilla.org/zh-cn/datasets	Common Voice Corpus 7.0
Librispeech	960	https://openslr.org/12/
ST-AEDS-20180100	4.7	http://www.openslr.org/45/
TED-Lium Release 3	430	https://openslr.org/51/
Mehrsprachiger Librispeech	44659	https://openslr.org/94/	Begrenzte Aufsicht
Spgispeech	5000	https://datasets.kenho.com/datasets/Scribe	falls verfügbar
Sprachbefehle	10	https://www.kaggle.com/c/tensorflow-speech-recognition-chalenge/data
2020aesrc	160	https://datatang.com/interspeech2020	falls verfügbar
Gigaspeech	10000	https://github.com/speechcolab/gigaspeech
Die Rede des Volkes	31400	https://openreview.net/pdf?id=r8cwidgj0yt
Einkommen-21	39	https://arxiv.org/abs/2104.11348
Voxpopuli	24100+543	https://arxiv.org/pdf/2101.00390.pdf	24100 (nicht beliebig), 543 (transkribiert)
CMU Wilderness Mehrsprachiger Sprachdatensatz	13	http://festvox.org/cmu_Wilderness/	Mehrsprachig
MSR-86K	9795.46	https://huggingface.co/datasets/alex-song/msr-86k	Mehrsprachig

Chinesisch-englisch

Name	Dauer/h	Adresse	Bemerkung
Seame	30	https://www.iscaspeech.org/archive_v0/archive_papers/interspeech_2010/i10_1986.pdf
Tal csasr	587	https://ai.100tal.com/dataset
ASRU2019 CSASR	200	https://www.datatang.com/competition	falls verfügbar
AUFSTEIGEN	10.62	https://arxiv.org/pdf/2112.06223.pdf

Japanisch (JA-JP)

Name	Dauer/h	Adresse	Bemerkung
Gemeinsame Stimme	26	https://commonvoice.mozilla.org/zh-cn/datasets	Common Voice Corpus 7.0
Japanisch_scriptted_speech_corpus_daily_use_sentence	18	https://magichub.io/cn/datasets/japanese-scriptted-speech-corpus-daily-use-ssence/
Laborotvspeech	2000	https://arxiv.org/pdf/2103.14736.pdf
CSJ	650	https://github.com/kaldi-asr/kaldi/tree/master/egs/csj
Jtubespeech	1300	https://arxiv.org/pdf/2112.09323.pdf
MSR-86K	1779.03	https://huggingface.co/datasets/alex-song/msr-86k	Mehrsprachig

Koreanisch (KO-Kr)

Name	Dauer/h	Adresse	Bemerkung
Korean-scripted-Speech-Corpus-täglich-Nutzungs-Sentenz	4.3	https://magichub.io/cn/datasets/korean-scriptted-speech-corpus-daily-use-ssence/
Koreanische Konversationsrede-Corpus	5.22	https://magichub.io/cn/datasets/korean-conversational-speech-corpus/
MSR-86K	10338.66	https://huggingface.co/datasets/alex-song/msr-86k	Mehrsprachig

Russisch (Ru-ru)

Name	Dauer/h	Adresse	Bemerkung
Gemeinsame Stimme	148	https://commonvoice.mozilla.org/zh-cn/datasets	Common Voice Corpus 7.0
Openstt	20000	https://arxiv.org/pdf/2006.08274.pdf	Begrenzte Aufsicht
MSR-86K	3188.52	https://huggingface.co/datasets/alex-song/msr-86k	Mehrsprachig

Französisch (FR-FR)

Name	Dauer/h	Adresse	Bemerkung
Mediaspeech	10	https://arxiv.org/pdf/2103.16193.pdf	ASR -Systembewertungsdatensatz
MSR-86K	8316.70	https://huggingface.co/datasets/alex-song/msr-86k	Mehrsprachig

Spanisch (ES-ES)

Name	Dauer/h	Adresse	Bemerkung
Mediaspeech	10	https://arxiv.org/pdf/2103.16193.pdf	ASR -Systembewertungsdatensatz
MSR-86K	13976.84	https://huggingface.co/datasets/alex-song/msr-86k	Mehrsprachig

Türkisch (tr-tr)

Name	Dauer/h	Adresse	Bemerkung
Mediaspeech	10	https://arxiv.org/pdf/2103.16193.pdf	ASR -Systembewertungsdatensatz

Arabisch (AR)

Name	Dauer/h	Adresse	Bemerkung
Mediaspeech	10	https://arxiv.org/pdf/2103.16193.pdf	ASR -Systembewertungsdatensatz
MSR-86K	873.84	https://huggingface.co/datasets/alex-song/msr-86k	Mehrsprachig

Noise & Nonspeech

Name	Dauer/h	Adresse
Musan	- -	https://openslr.org/17/
Raum Impulsantwort und Rauschdatenbank	- -	https://openslr.org/28/
Audioset	- -	https://ieeexplore.ieee.org/document/7952261

chinesisch

Name	Dauer/h	Adresse	Bemerkung
Aishell3	85	https://openslr.org/93/
OpenCpop	- -	https://wenet.org.cn/opencpop/download/	Singensynthese singen

Englisch

Name	Dauer/h	Adresse
Hi-Fi-Multi-Sprecher-Englisch-TTS-Datensatz	291.6	https://openslr.org/109/
Libritts Corpus	585	https://openslr.org/60/
Realocean762	- -	https://www.openslr.org/101/
Ryanspeech	10	http://mohammadmahoor.com/ryanspeech/

chinesisch

Name	Dauer/h	Adresse	Bemerkung	Anwendung
Aishell4	120	https://openslr.org/111/	8-Kanal, Konferenzszenarien	Spracherkennung, Sprecherdurchfallung
ASR & SD	160	http://ncmmsc2021.org/competition2.html	falls verfügbar	Spracherkennung, Sprecherdurchfallung
Zhijiangcup	- -	https://zhijiangcup.zhejianglab.com/zhijiang/match/details/id/6.html	falls verfügbar	Spracherkennung, Sprecherdurchfallung
M2met	120	https://arxiv.org/pdf/2110.07393.pdf	8-Kanal, Konferenzszenarien	Spracherkennung, Sprecherdurchfallung

Englisch

Name	Dauer/h	Adresse	Bemerkung	Anwendung
Chime-6	- -	https://chimechalenge.github.io/chime6/download.html	falls verfügbar	Spracherkennung, Sprecherdurchfallung

chinesisch

Name	Dauer/h	Adresse	Anwendung
CN-Celeb	- -	https://openslr.org/82/
Kespeech	1542	https://openreview.net/forum?id=b3zoeq2sclq	Spracherkennung, Sprecherüberprüfung, Identifizierung von Subdialekten, Sprachumwandlung
Mtass	55.6	https://github.com/windstudent/complex-mtassnet
Thchs-30	40	http://www.opensslr.org/18/

Englisch

Name	Dauer/h	Adresse	Bemerkung
Voxceleb -Daten	- -	http://www.robots.ox.ac.uk/~vgg/data/voxceleb/

Französisch

Name	Dauer/h	Adresse	Bemerkung	Anwendung
Inagvad	5	https://github.com/ina-foss/inagvad	10 Radio- und 18 TV -Kanäle	Erkennung von Sprachaktivität, Sprecher -Geschlechtsgmentierung, Geschlechtsüberwachung

Expandieren

Zusätzliche Informationen