การดาวน์โหลด Speech Corpus Collection - คำพูด - Speech Corpus Collection ซอร์สโค้ดดาวน์โหลดซอร์สโค้ด

Speech Corpus Collection

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

คำพูด

repo นี้เป็นคอลเลกชันของคลังข้อมูลสำหรับการรู้จำเสียงพูดอัตโนมัติ (ASR) และข้อความเป็นคำพูด (TTS)

ASR Corpus

VCTK
ประมาณ 10.4GB โฮสต์ทางเลือก
librispeech
คลังข้อมูลขนาดใหญ่ (1,000 ชั่วโมง) ของการอ่านคำพูดภาษาอังกฤษ
Tedlium release 2
Ted-lium corpus ทำจากการเจรจาด้านเสียงและการถอดความของพวกเขาที่มีอยู่ในเว็บไซต์ TED ผู้เขียนได้เตรียมและกรองข้อมูลเหล่านี้เพื่อฝึกอบรมโมเดลอะคูสติกเพื่อเข้าร่วมการประชุมเชิงปฏิบัติการระหว่างประเทศเกี่ยวกับการแปลภาษาพูด 2011 (ระบบ LIUM English/French SLT มาถึงอันดับแรกในงาน SLT)

TTS Corpus

ฐานข้อมูล CMU Arctic
ฐานข้อมูลประกอบด้วยคำพูดประมาณ 1,150 คำรวมถึง US English Male (BDL) และลำโพงหญิง (SLT) รวมถึงลำโพงที่เน้นเสียงอื่น ๆ
พระคัมภีร์ภาษาอังกฤษโลก
World English Bible เป็นการอัปเดตโดเมนสาธารณะของเวอร์ชันมาตรฐานอเมริกันในปี 1901 เป็นภาษาอังกฤษสมัยใหม่ การบันทึกข้อความและเสียงของมันสามารถใช้งานได้อย่างอิสระที่นี่ อย่างไรก็ตามน่าเสียดายที่ไฟล์เสียงแต่ละไฟล์ตรงกับบทไม่ใช่ข้อดังนั้นในกรณีส่วนใหญ่นานเกินไป Kyubyong หั่นพวกเขาด้วยบทกวีด้วยตนเอง คุณสามารถรับพวกเขาใน Dropbox ของเขา
แนนซี่คอร์ปัส
Nancy Corpus จาก 2011 Blizzard Challenge ข้อมูลมีประโยชน์อย่างอิสระสำหรับการใช้งานวิจัยเกี่ยวกับการลงนามในใบอนุญาต

ทั่วไป

ชุดข้อมูล nsynth
Nsynth เป็นชุดข้อมูลเสียงที่มีโน้ตดนตรี 305,979 รายการแต่ละอันมีระดับเสียงที่ไม่ซ้ำกันเสียงต่ำและซองจดหมาย สำหรับเครื่องมือ 1,006 เครื่องจากห้องสมุดตัวอย่างเชิงพาณิชย์เราได้สร้างตัวอย่างเสียงโมโนโฟนิก 16KHz สี่วินาทีเรียกว่าหมายเหตุโดยมีการจัดเรียงทุกสนามของ MIDI Pian O (21-108) รวมถึงความเร็วที่แตกต่างกัน (25, 25, 75, 100, 127) โน้ตถูกจัดขึ้นในช่วงสามวินาทีแรกและได้รับอนุญาตให้สลายตัวในวินาทีสุดท้าย