speech_datasetダウンロードspeech_datasetソースコードのダウンロード

日本語

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

ホーム>プログラミング関連>AI ソースコード

speech_dataset

AI ソースコード

v0.1

ダウンロード

音声認識のデータセット

中国語

名前	期間/h	住所	述べる	応用
thchs-30	30	https://openslr.org/18/
アイシェル	150	https://openslr.org/33/
st-cmds	110	https://openslr.org/38/
Primewords	99	https://openslr.org/47/
エイダタタン	200	https://openslr.org/62/
MagicData	755	https://openslr.org/68/
ASR＆SD	160	http://ncmmsc2021.org/competition2.html	利用可能な場合
aishell2	1000	http://www.aishelltech.com/aishell_2	利用可能な場合
TAL ASR	100	https://ai.100tal.com/dataset
一般的な声	63	https://commonvoice.mozilla.org/zh-cn/datasets	一般的な音声コーパス7.0
ASRU2019 ASR	500	https://www.datatang.com/competition	利用可能な場合
2021 SLT CSRC	398	https://www.data-baker.com/csrc_challenge.html	利用可能な場合
aidatatang_1505zh	1505	https://datatang.com/opensource	利用可能な場合
wenetspeech	10000	https://github.com/wenet-e2e/wenetspeech
kespeech	1542	https://openreview.net/forum?id=b3zoeq2sclq		音声認識、スピーカーの検証、サブダイリア性の識別、音声変換
MagicData-Ramc	180	https://arxiv.org/pdf/2203.16844.pdf	マンダリン中国語のネイティブスピーカーから記録された会話の音声データ
マンダリンヘビーアクセント会話スピーチコーパス	58.78	https://magichub.com/datasets/mandarin-heavy-centonational speech-corpus/
無料のセントチャイニーズマンダリンコーパス	-	https://openslr.org/38/

英語

名前	期間/h	住所	述べる
一般的な声	2015年	https://commonvoice.mozilla.org/zh-cn/datasets	一般的な音声コーパス7.0
Librispeech	960	https://openslr.org/12/
ST-AEDS-20180100	4.7	http://www.openslr.org/45/
Ted-Liumリリース3	430	https://openslr.org/51/
多言語のLibrispeech	44659	https://openslr.org/94/	限られた監督
spgispeech	5000	https://datasets.kensho.com/datasets/scribe	利用可能な場合
音声コマンド	10	https://www.kaggle.com/c/tensorfloweech-ecognition-challenge/data
2020AESRC	160	https://datatang.com/interspeech2020	利用可能な場合
Gigaspeech	10000	https://github.com/speechcolab/gigaspeech
人々のスピーチ	31400	https://openreview.net/pdf?id=r8cwidgj0yt
収益21	39	https://arxiv.org/abs/2104.11348
Voxpopuli	24100+543	https://arxiv.org/pdf/2101.00390.pdf	24100（無効）、543（転写）
CMU Wilderness多言語音声データセット	13	http://festvox.org/cmu_wilderness/	多言語
MSR-86K	9795.46	https://huggingface.co/datasets/alex-song/msr-86k	多言語

中国語 - 英語

名前	期間/h	住所	述べる
シーム	30	https://www.iscapeech.org/archive_v0/archive_papers/interspeech_2010/i10_1986.pdf
TAL CSASR	587	https://ai.100tal.com/dataset
ASRU2019 CSASR	200	https://www.datatang.com/competition	利用可能な場合
上昇します	10.62	https://arxiv.org/pdf/2112.06223.pdf

日本人（JA-JP）

名前	期間/h	住所	述べる
一般的な声	26	https://commonvoice.mozilla.org/zh-cn/datasets	一般的な音声コーパス7.0
Japany_scripted_speech_corpus_daily_use_sentence	18	https://magichub.io/cn/datasets/japanese-speheech-corpus-daily-use-sentence/
laborotvspeech	2000	https://arxiv.org/pdf/2103.14736.pdf
CSJ	650	https://github.com/kaldi-asr/kaldi/tree/master/egs/csj
jtubespeech	1300	https://arxiv.org/pdf/2112.09323.pdf
MSR-86K	1779.03	https://huggingface.co/datasets/alex-song/msr-86k	多言語

韓国（ko-kr）

名前	期間/h	住所	述べる
韓国語のスピーチ - コルパスダイレイの使用センテンス	4.3	https://magichub.io/cn/datasets/korean-speheech-corpus-daily-use-sentence/
韓国語を構成するスピーチ - コルパス	5.22	https://magichub.io/cn/datasets/korean-conversationalspeech-corpus/
MSR-86K	10338.66	https://huggingface.co/datasets/alex-song/msr-86k	多言語

ロシア語（ru-ru）

名前	期間/h	住所	述べる
一般的な声	148	https://commonvoice.mozilla.org/zh-cn/datasets	一般的な音声コーパス7.0
Openstt	20000	https://arxiv.org/pdf/2006.08274.pdf	限られた監督
MSR-86K	3188.52	https://huggingface.co/datasets/alex-song/msr-86k	多言語

フランス語（fr-fr）

名前	期間/h	住所	述べる
mediaspeech	10	https://arxiv.org/pdf/2103.16193.pdf	ASRシステム評価データセット
MSR-86K	8316.70	https://huggingface.co/datasets/alex-song/msr-86k	多言語

スペイン語（es-es）

名前	期間/h	住所	述べる
mediaspeech	10	https://arxiv.org/pdf/2103.16193.pdf	ASRシステム評価データセット
MSR-86K	13976.84	https://huggingface.co/datasets/alex-song/msr-86k	多言語

トルコ語（TR-TR）

名前	期間/h	住所	述べる
mediaspeech	10	https://arxiv.org/pdf/2103.16193.pdf	ASRシステム評価データセット

アラビア語（AR）

名前	期間/h	住所	述べる
mediaspeech	10	https://arxiv.org/pdf/2103.16193.pdf	ASRシステム評価データセット
MSR-86K	873.84	https://huggingface.co/datasets/alex-song/msr-86k	多言語

ノイズと非音

名前	期間/h	住所	述べる
ムーサン	-	https://openslr.org/17/
部屋のインパルス応答とノイズデータベース	-	https://openslr.org/28/
オーディオセット	-	https://ieeexplore.ieee.org/document/7952261

音声合成のデータセット

中国語

名前	期間/h	住所	述べる
aishell3	85	https://openslr.org/93/
opencpop	-	https://wenet.org.cn/opencpop/download/	音声合成を歌います

英語

名前	期間/h	住所	述べる
HI-FIマルチスピーカー英語TTSデータセット	291.6	https://openslr.org/109/
Libritts Corpus	585	https://openslr.org/60/
speechocean762	-	https://www.openslr.org/101/
Ryanspeech	10	http://mohammadmahoor.com/ryanspeech/

音声認識とスピーカーのダイアリゼーションのデータセット

中国語

名前	期間/h	住所	述べる	応用
aishell4	120	https://openslr.org/111/	8チャンネル、会議シナリオ	音声認識、スピーカーダイアリゼーション
ASR＆SD	160	http://ncmmsc2021.org/competition2.html	利用可能な場合	音声認識、スピーカーダイアリゼーション
zhijiangcup	-	https://zhijiangcup.zhejianglab.com/zhijiang/match/details/id/6.html	利用可能な場合	音声認識、スピーカーダイアリゼーション
m2met	120	https://arxiv.org/pdf/2110.07393.pdf	8チャンネル、会議シナリオ	音声認識、スピーカーダイアリゼーション

英語

名前	期間/h	住所	述べる	応用
チャイム-6	-	https://chimechallenge.github.io/chime6/download.html	利用可能な場合	音声認識、スピーカーダイアリゼーション

スピーカー認識のデータセット

中国語

名前	期間/h	住所	述べる	応用
CN-Celeb	-	https://openslr.org/82/
kespeech	1542	https://openreview.net/forum?id=b3zoeq2sclq		音声認識、スピーカーの検証、サブダイリア性の識別、音声変換
mtass	55.6	https://github.com/windstudent/complex-mtassnet
thchs-30	40	http://www.openslr.org/18/

英語

名前	期間/h	住所	述べる
VoxceleBデータ	-	http://www.robots.ox.ac.uk/~vgg/data/voxceleb/

音声アクティビティ検出のデータセット

フランス語

名前	期間/h	住所	述べる	応用
inagvad	5	https://github.com/ina-foss/inagvad	10個のラジオと18のテレビチャンネル	音声アクティビティ検出、スピーカーの性別セグメンテーション、性別監視

拡大する

追加情報

バージョン v0.1
タイプ AI ソースコード
更新時間 2025-08-22
サイズ 8.22KB
から Github

関連アプリ

ears_dataset

2024-11-14
OpenCore_NO_ACPI_Build

2024-11-13
zkwork_aleo_gpu_worker

2024-11-11
glaucoma dataset metadata

2024-11-09
ffhq wrinkle dataset

2024-11-07
nextcloud_share_url_downloader

2024-11-01

おすすめ

chat.petals.dev

その他のソースコード

1.0.0
GPT Prompt Templates

その他のソースコード

1.0.0
GPTyped

その他のソースコード

GPTyped 1.0.5
ML stack

AI ソースコード

1.0.0
awesome free chatgpt

AI ソースコード

1.0.0
pywin_contextmenu

AI ソースコード

Version update
Google Dorks

その他のソースコード

1.0
shepherd

その他のソースコード

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

その他のソースコード

v1.1.0-rc-3

関連情報すべて