speech_dataset
v0.1
ชาวจีน
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด | แอปพลิเคชัน |
|---|---|---|---|---|
| thchs-30 | 30 | https://openslr.org/18/ | ||
| ไอชิล | 150 | https://openslr.org/33/ | ||
| ST-CMDS | 110 | https://openslr.org/38/ | ||
| คำดาม | 99 | https://openslr.org/47/ | ||
| Aidatatang | 200 | https://openslr.org/62/ | ||
| วิเศษ | 755 | https://openslr.org/68/ | ||
| ASR & SD | 160 | http://ncmmsc2021.org/competition2.html | ถ้ามี | |
| aishell2 | 1,000 | http://www.aishelltech.com/aishell_2 | ถ้ามี | |
| tal asr | 100 | https://ai.100tal.com/dataset | ||
| เสียงทั่วไป | 63 | https://commonvoice.mozilla.org/zh-cn/datasets | เสียงทั่วไป Corpus 7.0 | |
| ASRU2019 ASR | 500 | https://www.datatang.com/competition | ถ้ามี | |
| 2021 SLT CSRC | 398 | https://www.data-baker.com/csrc_challenge.html | ถ้ามี | |
| Aidatatang_1505ZH | 1505 | https://datatang.com/opensource | ถ้ามี | |
| Wenetspeech | 10,000 | https://github.com/wenet-e2e/wenetspeech | ||
| Kespeech | ค.ศ. 1542 | https://openreview.net/forum?id=b3zoeq2sclq | การรู้จำเสียงการตรวจสอบผู้พูดการระบุตัวตนของ subdialect การแปลงเสียง | |
| MagicData-RAMC | 180 | https://arxiv.org/pdf/2203.16844.pdf | ข้อมูลการพูดการสนทนาที่บันทึกจากเจ้าของภาษาแมนดารินจีน | |
| คลังคำพูดการสนทนาสำเนียงแมนดารินหนัก | 58.78 | https://magichub.com/datasets/mandarin-heavy-accent-conversational-speech-corpus/ | ||
| ฟรีคลังภาษาแมนดารินจีน | - | https://openslr.org/38/ |
ภาษาอังกฤษ
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด |
|---|---|---|---|
| เสียงทั่วไป | ปี 2558 | https://commonvoice.mozilla.org/zh-cn/datasets | เสียงทั่วไป Corpus 7.0 |
| librispeech | 960 | https://openslr.org/12/ | |
| ST-AAEDS-20180100 | 4.7 | http://www.openslr.org/45/ | |
| Ted-lium release 3 | 430 | https://openslr.org/51/ | |
| Librispeech หลายภาษา | 44659 | https://openslr.org/94/ | การกำกับดูแลที่ จำกัด |
| spgispeech | 5,000 | https://datasets.kensho.com/datasets/scribe | ถ้ามี |
| คำสั่งพูด | 10 | https://www.kaggle.com/c/tensorflow-speech-recognition-challenge/data | |
| 2020AESRC | 160 | https://datatang.com/interspeech2020 | ถ้ามี |
| คนขี้เกียจ | 10,000 | https://github.com/speechcolab/gigaspeech | |
| คำพูดของผู้คน | 31400 | https://openreview.net/pdf?id=R8CWIDGJ0YT | |
| รายได้ 21 | 39 | https://arxiv.org/abs/2104.11348 | |
| voxpopuli | 24100+543 | https://arxiv.org/pdf/2101.00390.pdf | 24100 (ไม่มีป้ายกำกับ), 543 (ถอดความ) |
| ชุดข้อมูลคำพูดหลายภาษา CMU Wilderness | 13 | http://festvox.org/cmu_wilderness/ | พูดได้หลายภาษา |
| MSR-86K | 9795.46 | https://huggingface.co/datasets/alex-song/msr-86k | พูดได้หลายภาษา |
ภาษาจีน-อังกฤษ
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด |
|---|---|---|---|
| เรือรบ | 30 | https://www.isca-speech.org/archive_v0/archive_papers/interspeech_2010/i10_1986.pdf | |
| tal csasr | 587 | https://ai.100tal.com/dataset | |
| ASRU2019 CSASR | 200 | https://www.datatang.com/competition | ถ้ามี |
| ขึ้นไป | 10.62 | https://arxiv.org/pdf/2112.06223.pdf |
ญี่ปุ่น (JA-JP)
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด |
|---|---|---|---|
| เสียงทั่วไป | 26 | https://commonvoice.mozilla.org/zh-cn/datasets | เสียงทั่วไป Corpus 7.0 |
| jannapeans_scripted_speech_corpus_daily_use_sentence | 18 | https://magichub.io/cn/datasets/japanese-scripted-speech-corpus-daily-use-use-sentence/ | |
| LaborotvSpeech | ปี 2000 | https://arxiv.org/pdf/2103.14736.pdf | |
| CSJ | 650 | https://github.com/kaldi-asr/kaldi/tree/master/egs/csj | |
| jtubespeech | 1300 | https://arxiv.org/pdf/2112.09323.pdf | |
| MSR-86K | พ.ศ. 1779.03 | https://huggingface.co/datasets/alex-song/msr-86k | พูดได้หลายภาษา |
เกาหลี (KO-KR)
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด |
|---|---|---|---|
| เกาหลี-สคริปต์-corpus-daily-use-sentence | 4.3 | https://magichub.io/cn/datasets/korean-scripted-speech-corpus-daily-use-use-sentence/ | |
| การพูดภาษาเกาหลี-corpus | 5.22 | https://magichub.io/cn/datasets/korean-conversational-speech-corpus/ | |
| MSR-86K | 10338.66 | https://huggingface.co/datasets/alex-song/msr-86k | พูดได้หลายภาษา |
รัสเซีย (Ru-Ru)
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด |
|---|---|---|---|
| เสียงทั่วไป | 148 | https://commonvoice.mozilla.org/zh-cn/datasets | เสียงทั่วไป Corpus 7.0 |
| Openstt | ปี 20000 | https://arxiv.org/pdf/2006.08274.pdf | การกำกับดูแลที่ จำกัด |
| MSR-86K | 3188.52 | https://huggingface.co/datasets/alex-song/msr-86k | พูดได้หลายภาษา |
ฝรั่งเศส (FR-FR)
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด |
|---|---|---|---|
| สื่อกลาง | 10 | https://arxiv.org/pdf/2103.16193.pdf | ชุดข้อมูลการประเมินระบบ ASR |
| MSR-86K | 8316.70 | https://huggingface.co/datasets/alex-song/msr-86k | พูดได้หลายภาษา |
สเปน (ES-ES)
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด |
|---|---|---|---|
| สื่อกลาง | 10 | https://arxiv.org/pdf/2103.16193.pdf | ชุดข้อมูลการประเมินระบบ ASR |
| MSR-86K | 13976.84 | https://huggingface.co/datasets/alex-song/msr-86k | พูดได้หลายภาษา |
ตุรกี (TR-TR)
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด |
|---|---|---|---|
| สื่อกลาง | 10 | https://arxiv.org/pdf/2103.16193.pdf | ชุดข้อมูลการประเมินระบบ ASR |
ภาษาอาหรับ (AR)
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด |
|---|---|---|---|
| สื่อกลาง | 10 | https://arxiv.org/pdf/2103.16193.pdf | ชุดข้อมูลการประเมินระบบ ASR |
| MSR-86K | 873.84 | https://huggingface.co/datasets/alex-song/msr-86k | พูดได้หลายภาษา |
เสียงรบกวนและไม่พูด
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด |
|---|---|---|---|
| มูลัน | - | https://openslr.org/17/ | |
| ฐานข้อมูลการตอบสนองของแรงกระตุ้นและเสียงรบกวน | - | https://openslr.org/28/ | |
| เครื่องเสียง | - | https://ieeexplore.ieee.org/document/7952261 |
ชาวจีน
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด |
|---|---|---|---|
| aishell3 | 85 | https://openslr.org/93/ | |
| opencpop | - | https://wenet.org.cn/opencpop/download/ | การสังเคราะห์เสียงร้องเพลง |
ภาษาอังกฤษ
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด |
|---|---|---|---|
| ชุดข้อมูล TTS ภาษาอังกฤษหลายลำโพง Hi-Fi | 291.6 | https://openslr.org/109/ | |
| ห้องสมุดคลังข้อมูล | 585 | https://openslr.org/60/ | |
| Speechocean762 | - | https://www.openslr.org/101/ | |
| Ryanspeech | 10 | http://mohammadmahoor.com/ryanspeech/ |
ชาวจีน
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด | แอปพลิเคชัน |
|---|---|---|---|---|
| aishell4 | 120 | https://openslr.org/111/ | 8 ช่องทางสถานการณ์การประชุม | การรู้จำเสียงพูด diarization ของผู้พูด |
| ASR & SD | 160 | http://ncmmsc2021.org/competition2.html | ถ้ามี | การรู้จำเสียงพูด diarization ของผู้พูด |
| Zhijiangcup | - | https://zhijiangcup.zhejianglab.com/zhijiang/match/details/id/6.html | ถ้ามี | การรู้จำเสียงพูด diarization ของผู้พูด |
| M2MET | 120 | https://arxiv.org/pdf/2110.07393.pdf | 8 ช่องทางสถานการณ์การประชุม | การรู้จำเสียงพูด diarization ของผู้พูด |
ภาษาอังกฤษ
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด | แอปพลิเคชัน |
|---|---|---|---|---|
| Chime-6 | - | https://chimechallenge.github.io/chime6/download.html | ถ้ามี | การรู้จำเสียงพูด diarization ของผู้พูด |
ชาวจีน
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด | แอปพลิเคชัน |
|---|---|---|---|---|
| CN-CELEB | - | https://openslr.org/82/ | ||
| Kespeech | ค.ศ. 1542 | https://openreview.net/forum?id=b3zoeq2sclq | การรู้จำเสียงการตรวจสอบผู้พูดการระบุตัวตนของ subdialect การแปลงเสียง | |
| MTASS | 55.6 | https://github.com/windstudent/complex-mtassnet | ||
| thchs-30 | 40 | http://www.openslr.org/18/ |
ภาษาอังกฤษ
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด |
|---|---|---|---|
| ข้อมูล voxceleb | - | http://www.robots.ox.ac.uk/~vgg/data/voxceleb/ |
ภาษาฝรั่งเศส
| ชื่อ | ระยะเวลา/h | ที่อยู่ | คำพูด | แอปพลิเคชัน |
|---|---|---|---|---|
| inagvad | 5 | https://github.com/ina-foss/inagvad | 10 วิทยุและช่องทีวี 18 ช่อง | การตรวจจับกิจกรรมเสียงการแบ่งส่วนเพศลำโพงการตรวจสอบเพศ |