การดำเนินการของ TTS ด้วยการรวมกันของ Tacotron2 และ HIFI-GAN สำหรับแมนดาริน TTS
เพื่อที่จะอนุมานเราจำเป็นต้องดาวน์โหลดโมเดล Tacotraon2 ที่ผ่านการฝึกอบรมมาแล้วสำหรับภาษาจีนกลางและวางในเส้นทางรูท จากนั้นเราสามารถเรียกใช้ infer_tacotron2_hifigan.py เพื่อรับผลลัพธ์ TTS เราสามารถเปลี่ยนข้อความอินพุตโดยการแก้ไข text ตัวแปรใน infer_tacotron2_hifigan.py จากนั้นผลลัพธ์จะถูกบันทึกไว้ในเส้นทางรูทชื่อเป็น output.wav
รูปแบบที่ผ่านการฝึกอบรมมาก่อนของ HIFI-GAN ได้ถูกวางไว้ใน LJ_FT_T2_V3 ซึ่งได้รับการฝึกฝนโดย LJSPPECH และปรับแต่งด้วย Tacotron2 คุณสามารถค้นหาโมเดลที่ผ่านการฝึกอบรมมาก่อนได้จาก repo hifi-gan ดั้งเดิมที่มีขนาดและพารามิเตอร์ที่แตกต่างกัน หากคุณต้องการลองใช้โมเดลที่แตกต่างกันหรือฝึกอบรมโมเดลของคุณเองโปรดอย่าลืมเปลี่ยนตัวแปรใน infer_tacotron2_hifigan.py เพื่อเปลี่ยนเส้นทางของโมเดล HIFI-GAN
อินพุต:相对论直接和间接的催生了量子力学的诞生也为研究微观世界的高速运动确立了全新的数学模型
เอาท์พุท: tacotron22-hifigan.wav