Download de speech_dataset - speech

speech_dataset

Código-Fonte de IA

v0.1

Baixar

O conjunto de dados do reconhecimento de fala

chinês

nome	duração/h	endereço	observação	aplicativo
Thchs-30	30	https://openslr.org/18/
Aishell	150	https://openslr.org/33/
ST-CMDS	110	https://openslr.org/38/
Primewords	99	https://openslr.org/47/
Aidatatang	200	https://openslr.org/62/
MagicData	755	https://openslr.org/68/
ASR & SD	160	http://ncmmsc2021.org/competition2.html	se disponível
Aishell2	1000	http://www.aishelltech.com/aishell_2	se disponível
Tal asr	100	https://ai.100tal.com/dataset
Voz comum	63	https://commonvoice.mozilla.org/zh-cn/datasets	Voz comum Corpus 7.0
ASRU2019 ASR	500	https://www.datatang.com/competition	se disponível
2021 SLT CSRC	398	https://www.data-baker.com/csrc_challenge.html	se disponível
Aidatatang_1505zh	1505	https://datatang.com/opensource	se disponível
Wenetspeech	10000	https://github.com/wenet-e2e/wenetspeech
KESPEECH	1542	https://openreview.net/forum?id=b3zoeq2sclq		Reconhecimento de fala, verificação do alto -falante, identificação de subdialect, conversão de voz
MagicData-ramc	180	https://arxiv.org/pdf/2203.16844.pdf	Dados de fala conversacional registrados de falantes nativos de mandarim chinês
Corpus de fala de conversação com sotaque pesado de mandarim	58,78	https://magichub.com/datasets/mandarin-heavy-accent-conversational-peech-corpus/
Corpus de mandarim chinês gratuito	-	https://openslr.org/38/

Inglês

nome	duração/h	endereço	observação
Voz comum	2015	https://commonvoice.mozilla.org/zh-cn/datasets	Voz comum Corpus 7.0
Librispeech	960	https://openslr.org/12/
ST-AEDS-20180100	4.7	http://www.openslr.org/45/
TED Lium Release 3	430	https://openslr.org/51/
Librispeech multilíngue	44659	https://openslr.org/94/	supervisão limitada
SpgisCeech	5000	https://datasets.kensho.com/datasets/scribe	se disponível
Comandos de fala	10	https://www.kaggle.com/c/tensorflow-peel--recognition-challenge/data
2020AESRC	160	https://datatang.com/interspeech2020	se disponível
Gigaspeech	10000	https://github.com/speechcolab/gigaspeech
O discurso do povo	31400	https://openreview.net/pdf?id=r8cwidgj0yt
Ganhos-21	39	https://arxiv.org/abs/2104.11348
Voxpopuli	24100+543	https://arxiv.org/pdf/2101.00390.pdf	24100 (não marcado), 543 (transcrito)
CMU Wilderness Multilingual Speech DataSet	13	http://festvox.org/cmu_wilderness/	Multilíngue
MSR-86K	9795.46	https://huggingface.co/datasets/alex-song/msr-86k	Multilíngue

Chinês-inglês

nome	duração/h	endereço	observação
Costura	30	https://www.isca-speech.org/archive_v0/archive_papers/interspeech_2010/i10_1986.pdf
Tal csasr	587	https://ai.100tal.com/dataset
ASRU2019 CSASR	200	https://www.datatang.com/competition	se disponível
SUBIR	10.62	https://arxiv.org/pdf/2112.06223.pdf

Japonês (JA-JP)

nome	duração/h	endereço	observação
Voz comum	26	https://commonvoice.mozilla.org/zh-cn/datasets	Voz comum Corpus 7.0
Japonês_scripted_speech_corpus_daily_use_sentence	18	https://magichub.io/cn/datasets/japanese-scripted-seech-corpus-aily-use-sentence/
LaborotvSpeech	2000	https://arxiv.org/pdf/2103.14736.pdf
CSJ	650	https://github.com/kaldi-asr/kaldi/tree/master/egs/csj
JTUBESPESECH	1300	https://arxiv.org/pdf/2112.09323.pdf
MSR-86K	1779.03	https://huggingface.co/datasets/alex-song/msr-86k	Multilíngue

Coreano (Ko-KR)

nome	duração/h	endereço	observação
Feedia de Use-Use-Repolho-Escrete-Screindo-Corpus-Corpos-Diário	4.3	https://magichub.io/cn/datasets/korean-scripted-seech-corpus--aily-use-sentence/
Coréia-conversação-discree-corpus	5.22	https://magichub.io/cn/datasets/korean-conversational-seech-corpus/
MSR-86K	10338.66	https://huggingface.co/datasets/alex-song/msr-86k	Multilíngue

Russo (Ru-Ru)

nome	duração/h	endereço	observação
Voz comum	148	https://commonvoice.mozilla.org/zh-cn/datasets	Voz comum Corpus 7.0
OpenStt	20000	https://arxiv.org/pdf/2006.08274.pdf	supervisão limitada
MSR-86K	3188.52	https://huggingface.co/datasets/alex-song/msr-86k	Multilíngue

Francês (FR-FR)

nome	duração/h	endereço	observação
MediaSpeech	10	https://arxiv.org/pdf/2103.16193.pdf	Conjunto de dados de avaliação do sistema ASR
MSR-86K	8316.70	https://huggingface.co/datasets/alex-song/msr-86k	Multilíngue

Espanhol (ES-ES)

nome	duração/h	endereço	observação
MediaSpeech	10	https://arxiv.org/pdf/2103.16193.pdf	Conjunto de dados de avaliação do sistema ASR
MSR-86K	13976.84	https://huggingface.co/datasets/alex-song/msr-86k	Multilíngue

Turco (TR-TR)

nome	duração/h	endereço	observação
MediaSpeech	10	https://arxiv.org/pdf/2103.16193.pdf	Conjunto de dados de avaliação do sistema ASR

Árabe (AR)

nome	duração/h	endereço	observação
MediaSpeech	10	https://arxiv.org/pdf/2103.16193.pdf	Conjunto de dados de avaliação do sistema ASR
MSR-86K	873.84	https://huggingface.co/datasets/alex-song/msr-86k	Multilíngue

Ruído e não -peeech

nome	duração/h	endereço
Musan	-	https://openslr.org/17/
Banco de dados de resposta ao impulso de quarto e ruído	-	https://openslr.org/28/
Audioset	-	https://ieeexplore.ieee.org/document/7952261

O conjunto de dados da síntese de fala

chinês

nome	duração/h	endereço	observação
Aishell3	85	https://openslr.org/93/
OpenCpop	-	https://wenet.org.cn/opencpop/download/	Síntese de voz cantando

Inglês

nome	duração/h	endereço
DataSet em inglês multi-falante hi-fi	291.6	https://openslr.org/109/
Libritts Corpus	585	https://openslr.org/60/
Speechocean762	-	https://www.openslr.org/101/
Ryanspeech	10	http://mohammadmahoor.com/ryanspeech/

O conjunto de dados de reconhecimento de fala e diarização do alto -falante

chinês

nome	duração/h	endereço	observação	aplicativo
Aishell4	120	https://openslr.org/111/	Cenários de conferência de 8 canais	Reconhecimento de fala, diarização do alto -falante
ASR & SD	160	http://ncmmsc2021.org/competition2.html	se disponível	Reconhecimento de fala, diarização do alto -falante
Zhijiangcup	-	https://zhijiangcup.zhejianglab.com/zhijiang/match/details/id/6.html	se disponível	Reconhecimento de fala, diarização do alto -falante
M2met	120	https://arxiv.org/pdf/2110.07393.pdf	Cenários de conferência de 8 canais	Reconhecimento de fala, diarização do alto -falante

Inglês

nome	duração/h	endereço	observação	aplicativo
Chime-6	-	https://chimechallenge.github.io/chime6/download.html	se disponível	Reconhecimento de fala, diarização do alto -falante

O conjunto de dados do reconhecimento de alto -falante

chinês

nome	duração/h	endereço	aplicativo
CN-CELEB	-	https://openslr.org/82/
KESPEECH	1542	https://openreview.net/forum?id=b3zoeq2sclq	Reconhecimento de fala, verificação do alto -falante, identificação de subdialect, conversão de voz
Mtass	55.6	https://github.com/windstudent/complex-mtassnet
Thchs-30	40	http://www.openslr.org/18/

Inglês

nome	duração/h	endereço	observação
Dados voxceleb	-	http://www.robots.ox.ac.uk/~vgg/data/voxceleb/

O conjunto de dados da detecção de atividade de voz

Francês

nome	duração/h	endereço	observação	aplicativo
Inagvad	5	https://github.com/ina-foss/inagvad	10 canais de rádio e 18 TV	Detecção de atividades de voz, segmentação de gênero do alto -falante, monitoramento de gênero

Expandir

Informações adicionais

Versão v0.1
Tipo Código-Fonte de IA
Data da Última Atualização 2025-08-22
tamanho 8.22KB
Vindo de Github

Aplicativos Relacionados

ears_dataset

2024-11-14
OpenCore_NO_ACPI_Build

2024-11-13
zkwork_aleo_gpu_worker

2024-11-11
glaucoma dataset metadata

2024-11-09
ffhq wrinkle dataset

2024-11-07
nextcloud_share_url_downloader

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos