ระบบการวิเคราะห์คำพูด/การสังเคราะห์สำหรับ TTS และแอปพลิเคชันที่เกี่ยวข้อง
ซอฟต์แวร์นี้ใช้วิธีการที่อธิบายไว้ในกระดาษ:
F. Espic, C. Valentini-Botinhao และ S. King,“ การสร้างแบบจำลองโดยตรงของขนาดและสเปกตรัมเฟสสำหรับการสังเคราะห์พารามิเตอร์เชิงสถิติ” ใน Proc Interspeech, Stockholm, สวีเดน, สิงหาคม, 2017
@ ผู้แต่ง: Felipe Espic
ข้อมูลเพิ่มเติมที่ http://www.felipeespic.com/magphase/
นี่คือระบบการวิเคราะห์/การสังเคราะห์คลื่นเสียงพูดที่ใช้ในการสังเคราะห์พารามิเตอร์เชิงสถิติ (SPSS)
โมดูลการวิเคราะห์สกัดกระแสคุณลักษณะสี่แบบที่อธิบายถึงสเปกตรัมขนาดสเปกตรัมเฟสและ F0 คุณสมบัติเหล่านี้สามารถใช้ในการฝึกอบรมแบบจำลองการถดถอย (เช่น DNN, LSTM, HMM. ฯลฯ ) ดังนั้นจึงสามารถสร้างค่าที่คาดการณ์ได้ โมดูลการสังเคราะห์ใช้คุณสมบัติเหล่านี้ที่อินพุตเพื่อสร้างรูปคลื่นสังเคราะห์สุดท้าย
ประเด็นสำคัญ:
ดูไฟล์ใบอนุญาตสำหรับรายละเอียด
pip install numpy scipy soundfile matplotlib
ดาวน์โหลด magphase: git clone https://github.com/CSTR-Edinburgh/magphase.git
ดาวน์โหลดและรวบรวม SPTK และ Reaper โดย:
cd magphase/tools
./download_and_compile_tools.sh
สิ่งนี้จะรวบรวมและกำหนดค่า SPTK และ Reaper โดยอัตโนมัติสำหรับคุณ ... และนั่นก็คือ!
เพียงไปที่ /demos อ่านคำแนะนำภายในสคริปต์สาธิตซึ่งเป็นคำอธิบายมาก พวกเขาควรหมดกล่องโดยใช้ python <demo_script>
เราขอแนะนำว่าคุณเล่นเป็นครั้งแรกด้วย demo_copy_synthesis_lossless.py จากนั้น demo_copy_synthesis_low_dim.py พวกเขาทั้งสองดำเนินการวิเคราะห์/สังเคราะห์
จากนั้นคุณสามารถปรับเปลี่ยนสคริปต์สาธิตให้เหมาะกับความต้องการของคุณ
หมายเหตุ: อย่าลืมเรียกใช้สคริปต์จากสถานที่ของพวกเขา
เราให้บริการการสาธิตสองครั้งที่แจกจ่ายอย่างเป็นทางการของเมอร์ลิน ตัวอย่างการแสดงเหล่านี้ของ Merlin กับ Magphase Integration:
Text-to-Speech: Demo SLT_ARCTIC ของ Merlin (รุ่นย่อยขนาดเล็กและเต็มรูปแบบ)
การแปลงด้วยเสียง: การสาธิตการแปลงเสียงของเมอร์ลิน (ทดสอบโดยประมาณ)
เราต้องการความช่วยเหลือในการปรับปรุงซอฟต์แวร์นี้ คุณสามารถ colaborate โดย:
การสร้างเสียง TTS โดยใช้ Merlin และ Magphase และเปรียบเทียบกับนักร้องอื่น ๆ เช่นโลก จากนั้นโปรดบอกผลลัพธ์ของคุณ เราได้ทดสอบ magphase เพียงไม่กี่เสียงและจำเป็นต้องครอบคลุมช่วงที่กว้างขึ้น เมื่อเร็ว ๆ นี้เราได้แก้ไขข้อบกพร่องบางอย่างที่ออกมาขอบคุณผู้ที่รายงานผลลัพธ์ของพวกเขาโดยใช้ข้อมูลใหม่
การใช้การสนับสนุนอัตราเฟรมตัวแปรดั้งเดิมในเมอร์ลิน Magphase ทำงานในแฟชั่นอัตราเฟรมตัวแปร (pitch synchronous)