تنزيل speech_dataset - تنزيل رمز مصدر speech

speech_dataset

كود الذكاء الاصطناعي

v0.1

تنزيل

مجموعة بيانات التعرف على الكلام

الصينية

اسم	المدة/ح	عنوان	ملاحظة	طلب
thchs-30	30	https://openslr.org/18/
آيل	150	https://openslr.org/33/
ST-CMDS	110	https://openslr.org/38/
Primwords	99	https://openslr.org/47/
Aidatatang	200	https://openslr.org/62/
MagicData	755	https://openslr.org/68/
ASR & SD	160	http://ncmmsc2021.org/competition2.html	إذا كان متاحا
Aishell2	1000	http://www.aishelltech.com/aishell_2	إذا كان متاحا
تال عس	100	https://ai.100tal.com/dataset
صوت مشترك	63	https://commonvoice.mozilla.org/zh-cn/datasets	Common Voice Corpus 7.0
ASRU2019 ASR	500	https://www.datatang.com/competition	إذا كان متاحا
2021 SLT CSRC	398	https://www.data-baker.com/csrc_challenge.html	إذا كان متاحا
Aidatatang_1505zh	1505	https://datatang.com/opensource	إذا كان متاحا
Wenetspeech	10000	https://github.com/wenet-e2e/wenetspeech
Kespeech	1542	https://openreview.net/forum؟id=B3ZoeQ2Sclq		التعرف على الكلام ، والتحقق من المتحدث ، وتحديد التحديد الفرعي ، وتحويل الصوت
MagicData-Ramc	180	https://arxiv.org/pdf/2203.16844.pdf	بيانات الكلام المحادثة المسجلة من المتحدثين الأصليين في الماندرين الصينية
ماندرين لهجة الكلام المحادثة الثقيلة	58.78	https://magichub.com/datasets/mandarin-heavy-accent-conversational-speed-corpus/
حرة ماندرين الصينية الصينية	-	https://openslr.org/38/

إنجليزي

اسم	المدة/ح	عنوان	ملاحظة
صوت مشترك	2015	https://commonvoice.mozilla.org/zh-cn/datasets	Common Voice Corpus 7.0
Librispeech	960	https://openslr.org/12/
ST-AEDS-20180100	4.7	http://www.openslr.org/45/
تيد ليوم إطلاق 3	430	https://openslr.org/51/
Librispeech متعدد اللغات	44659	https://openslr.org/94/	إشراف محدود
spgispeech	5000	https://datasets.kensho.com/datasets/scribe	إذا كان متاحا
أوامر الكلام	10	https://www.kaggle.com/c/tensorflow-spheade-recognition-challenge/data
2020AESRC	160	https://datatang.com/interspeech2020	إذا كان متاحا
Gigaspeech	10000	https://github.com/speechcolab/gigaspeech
خطاب الشعب	31400	https://openreview.net/pdf؟id=r8cwidgj0yt
الأرباح 21	39	https://arxiv.org/abs/2104.11348
voxpopuli	24100+543	https://arxiv.org/pdf/2101.00390.pdf	24100 (غير مسماة) ، 543 (نسخ)
CMU Wilderness مجموعة بيانات الكلام متعددة اللغات	13	http://festvox.org/cmu_wilderness/	متعدد اللغات
MSR-86K	9795.46	https://huggingface.co/Datasets/alex-song/msr-86k	متعدد اللغات

الصينية-الإنجليزية

اسم	المدة/ح	عنوان	ملاحظة
خيط	30	https://www.isca-spheade.org/archive_v0/archive_papers/interspeech_2010/i10_1986.pdf
تل CSASR	587	https://ai.100tal.com/dataset
ASRU2019 CSASR	200	https://www.datatang.com/competition	إذا كان متاحا
صعود	10.62	https://arxiv.org/pdf/2112.06223.pdf

اليابانية (JA-JP)

اسم	المدة/ح	عنوان	ملاحظة
صوت مشترك	26	https://commonvoice.mozilla.org/zh-cn/datasets	Common Voice Corpus 7.0
اليابانية _scripted_speech_corpus_daily_use_sentence	18	https://magichub.io/cn/datasets/japanese-scripted-speed-corpus-daily-use-sentence/
LaborOtvspeech	2000	https://arxiv.org/pdf/2103.14736.pdf
CSJ	650	https://github.com/kaldi-asr/kaldi/tree/master/gs/csj
JTubeSeesh	1300	https://arxiv.org/pdf/2112.09323.pdf
MSR-86K	1779.03	https://huggingface.co/Datasets/alex-song/msr-86k	متعدد اللغات

الكورية (KO-KR)

اسم	المدة/ح	عنوان	ملاحظة
كوريا الكبرى-الكمل corpus-corpus-daily-sentence	4.3	https://magichub.io/cn/datasets/korean-scripted-spheade-corpus-daily-use-sentence/
كوريا الحادثة الكلام	5.22	https://magichub.io/cn/datasets/korean-conversational-speed-corpus/
MSR-86K	10338.66	https://huggingface.co/Datasets/alex-song/msr-86k	متعدد اللغات

الروسي (ru-ru)

اسم	المدة/ح	عنوان	ملاحظة
صوت مشترك	148	https://commonvoice.mozilla.org/zh-cn/datasets	Common Voice Corpus 7.0
Openstt	20000	https://arxiv.org/pdf/2006.08274.pdf	إشراف محدود
MSR-86K	3188.52	https://huggingface.co/Datasets/alex-song/msr-86k	متعدد اللغات

الفرنسية (FR-FR)

اسم	المدة/ح	عنوان	ملاحظة
MediaSpeech	10	https://arxiv.org/pdf/2103.16193.pdf	مجموعة بيانات تقييم نظام ASR
MSR-86K	8316.70	https://huggingface.co/Datasets/alex-song/msr-86k	متعدد اللغات

الإسبانية (es-es)

اسم	المدة/ح	عنوان	ملاحظة
MediaSpeech	10	https://arxiv.org/pdf/2103.16193.pdf	مجموعة بيانات تقييم نظام ASR
MSR-86K	13976.84	https://huggingface.co/Datasets/alex-song/msr-86k	متعدد اللغات

التركية (TR-TR)

اسم	المدة/ح	عنوان	ملاحظة
MediaSpeech	10	https://arxiv.org/pdf/2103.16193.pdf	مجموعة بيانات تقييم نظام ASR

اللغة العربية (AR)

اسم	المدة/ح	عنوان	ملاحظة
MediaSpeech	10	https://arxiv.org/pdf/2103.16193.pdf	مجموعة بيانات تقييم نظام ASR
MSR-86K	873.84	https://huggingface.co/Datasets/alex-song/msr-86k	متعدد اللغات

الضوضاء و nonspeech

اسم	المدة/ح	عنوان
موسان	-	https://openslr.org/17/
استجابة دافع الغرفة وقاعدة بيانات الضوضاء	-	https://openslr.org/28/
Audioset	-	https://ieeexplore.ieee.org/document/7952261

مجموعة بيانات توليف الكلام

الصينية

اسم	المدة/ح	عنوان	ملاحظة
Aishell3	85	https://openslr.org/93/
opencpop	-	https://wenet.org.cn/opencpop/download/	غناء تخليق الصوت

إنجليزي

اسم	المدة/ح	عنوان
Hi-Fi Multi-Speaker English TTS TTS	291.6	https://openslr.org/109/
Libritts Corpus	585	https://openslr.org/60/
PleaseOcean762	-	https://www.openslr.org/101/
Ryanspeech	10	http://mohammadmahoor.com/ryanspeech/

مجموعة بيانات التعرف على الكلام ومذكرات المتحدث

الصينية

اسم	المدة/ح	عنوان	ملاحظة	طلب
Aishell4	120	https://openslr.org/111/	8 قنوات ، سيناريوهات المؤتمر	التعرف على الكلام ، مذكرات المتحدث
ASR & SD	160	http://ncmmsc2021.org/competition2.html	إذا كان متاحا	التعرف على الكلام ، مذكرات المتحدث
Zhijiangcup	-	https://zhijiangcup.zhejianglab.com/zhijiang/match/details/id/6.html	إذا كان متاحا	التعرف على الكلام ، مذكرات المتحدث
M2met	120	https://arxiv.org/pdf/2110.07393.pdf	8 قنوات ، سيناريوهات المؤتمر	التعرف على الكلام ، مذكرات المتحدث

إنجليزي

اسم	المدة/ح	عنوان	ملاحظة	طلب
رنين 6	-	https://chimechallenge.github.io/chime6/download.html	إذا كان متاحا	التعرف على الكلام ، مذكرات المتحدث

مجموعة بيانات التعرف على السماعة

الصينية

اسم	المدة/ح	عنوان	طلب
CN-CELEB	-	https://openslr.org/82/
Kespeech	1542	https://openreview.net/forum؟id=B3ZoeQ2Sclq	التعرف على الكلام ، والتحقق من المتحدث ، وتحديد التحديد الفرعي ، وتحويل الصوت
mtass	55.6	https://github.com/windstudent/complex-mtassnet
thchs-30	40	http://www.openslr.org/18/

إنجليزي

اسم	المدة/ح	عنوان	ملاحظة
بيانات voxceleb	-	http://www.robots.ox.ac.uk/~vgg/data/voxceleb/

مجموعة بيانات اكتشاف النشاط الصوتي

فرنسي

اسم	المدة/ح	عنوان	ملاحظة	طلب
inagvad	5	https://github.com/ina-foss/inagvad	10 راديو و 18 قناة تلفزيونية	اكتشاف النشاط الصوتي ، تجزئة جنس المتحدثين ، مراقبة الجنس

يوسع

معلومات إضافية

الإصدار v0.1
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-08-22
الحجم 8.22KB
من Github

تطبيقات ذات صلة

ears_dataset

2024-11-14
OpenCore_NO_ACPI_Build

2024-11-13
zkwork_aleo_gpu_worker

2024-11-11
glaucoma dataset metadata

2024-11-09
ffhq wrinkle dataset

2024-11-07
nextcloud_share_url_downloader

2024-11-01

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل