TTS-Dataset-Prompts
[ถูกทอดทิ้งส่วนใหญ่ขอโทษ!]
ที่เก็บนี้มีจุดมุ่งหมายที่จะเป็นชุดประโยคที่ดีสำหรับคนที่ต้องการโคลนเสียงของตัวเอง (เช่นการใช้ทาโคทรอน 2)
แต่ละชุดของ 50 บรรทัดมีจุดมุ่งหมายเพื่อให้เป็นไปตามเกณฑ์ดังต่อไปนี้:
- ฟอนิมแต่ละอันมีการแสดงอย่างน้อยหนึ่งครั้งตาม cmudict (สระที่เครียดที่แตกต่างกันนับเป็นหน่วยเสียงแยกกันพยัญชนะจำเป็นต้องมีสองครั้ง)
- ฟอนิมแต่ละอันมีความถี่ประมาณเหมือนในการพูดปกติ (ระหว่าง 50% ถึง 150% ความถี่ที่มีอยู่ใน Moby Dick เว้นแต่ว่าฟอนิมจะมีเพียง 4 หรือน้อยกว่าในแบทช์)
- ทุกบรรทัดมีความยาวเท่ากันเมื่อพูด (14-18 พยางค์ + เครื่องหมายวรรคตอนที่ไม่ใช่รอบรองชนะเลิศ)
- คำที่มีการออกเสียงตามบริบท (ยกเว้นคำทั่วไปเช่น
the จะหลีกเลี่ยงเพื่อความสะดวกในการประมวลผล - อย่างน้อย 10 บรรทัดมีเครื่องหมายจุลภาค
- อย่างน้อย 10 บรรทัดประกอบด้วยประโยคที่สั้นกว่าหลายประโยค (เพื่อให้ AI เรียนรู้ที่จะหยุดชั่วคราวตามธรรมชาติ)
ไฟล์ข้อความเพิ่มเติมจะถูกจัดเตรียมไว้สำหรับคำถามและการตอบกลับตามกฎเดียวกัน พวกเขาถูกแยกออกเนื่องจากสถาปัตยกรรมแบบข้อความเป็นคำพูดบางอย่างจัดการได้ไม่ดีกับการสิ้นสุดเครื่องหมายวรรคตอนที่ส่งผลกระทบต่อการเกิดเสียงต่ำของประโยคทั้งหมด อาจเป็นประโยชน์ในการใช้สิ่งเหล่านี้เพื่อฝึกอบรมแบบจำลองแยกต่างหากตามที่ Talqu แนะนำและทำเพื่อเสียงบางอย่างในบริการ Mekatron (หมดอายุ)
repo นี้ใช้ไลบรารี G2P-en เพื่อกำหนดจำนวนฟอนิมเพื่อให้ตรงกับการออกเสียงของ Uberduck
ชุดพรอมต์ที่ดีอื่น ๆ
- (หลายภาษา!) สคริปต์ตัวอย่าง Microsoft CustomVoice (ไม่ใช่รายการพรอมต์ทั้งหมดที่ได้รับการออกแบบมาอย่างดีเช่นการแชท en-US Prompts รวมเฉพาะ / ʒ / เป็นส่วนหนึ่งของคำว่า "อินโดนีเซีย"))
- Passage Rainbow และ Prandfather Passage (สมบูรณ์แบบ)
- รายการพรอมต์ CMU Arctic (สมดุลทางสัณฐาน แต่มีเพียงหนึ่งประโยคต่อบรรทัด)
- Mocha-Timit ("ออกแบบมาเพื่อรวมกระบวนการพูดที่เชื่อมต่อหลักเป็นภาษาอังกฤษ (เช่นการดูดซึม, รูปแบบที่อ่อนแอ .. )")
- Timit (กองประโยคสุ่มส่วนใหญ่ส่วนใหญ่)
- (หลายภาษา!) ประโยคเสียงทั่วไป (ไม่สมดุลทางสัทศาสตร์ทั้งหมดค่อนข้างสั้น)
- ljSpeech transcript (ชิ้นส่วนประโยคมากมายซึ่งโดยส่วนตัวแล้วฉันคิดว่ามีประโยชน์)
- ประโยคฮาร์วาร์ด (มีความสมดุลทางสัณฐาน แต่มีเพียงหนึ่งประโยคต่อบรรทัดและพวกเขาทั้งหมดมีความยาวเท่ากัน)
- รายการการปรับแต่งอย่างรวดเร็ว (ทั้งภาษาอังกฤษและภาษาจีน แต่ประโยคสั้น ๆ และไวยากรณ์ไม่สมบูรณ์แบบ)