น่ากลัว tts-samples
รายการเอกสาร TTS พร้อมตัวอย่างเสียง ที่จัดทำโดยผู้เขียน แถวสุดท้ายของกระดาษแต่ละชิ้นแสดงการผกผันของสเปกโตรแกรม (Vocoder) ที่ใช้
สำหรับรายการที่ครอบคลุมมากขึ้นของเอกสาร TTS ที่สำคัญฉัน recommmend อ่าน XCMYZ/คำพูดสังเคราะห์ที่เขียนโดย Zhengxi Liu
2020
- fastpitch-fastpitch: ข้อความแบบขนานกับคำพูดพร้อมการทำนายพิทช์
- https://fastpitch.github.io/
- เครื่องเป่านก
- Eats-การพูดแบบ end-to-end-to-end
- https://deepmind.com/research/publications/end-to-end-adversarial-text-to-peech
- รุ่น end-to-end
- Glow-TTS-Glow-TTS: กระแสกำเนิดสำหรับข้อความเป็นคำพูดผ่านการค้นหาการจัดตำแหน่งแบบโมโนโทนิก
- https://jaywalnut310.github.io/glow-tts-demo
- เครื่องเป่านก
- flowtron-flowtron: เครือข่ายการกำเนิดแบบโฟลว์แบบอัตโนมัติสำหรับการสังเคราะห์แบบข้อความเป็นคำพูด
- https://nv-adlr.github.io/flowtron
- เครื่องเป่านก
2019
- TACOTRON2+DCA-กลไกความสนใจในสถานที่สำหรับการสังเคราะห์การพูดแบบยาวที่แข็งแกร่ง
- https://google.github.io/tacotron/publications/location_relative_attention
- เวิร์นน์
- GAN -TTS - การสังเคราะห์คำพูดที่มีความซื่อสัตย์สูงด้วยเครือข่ายฝ่ายตรงข้าม
- https://storage.googleapis.com/deepmind-media/research/abstract.wav
- โมเดลแบบ end-to-end (สร้างขึ้นบนคุณสมบัติทางภาษาศาสตร์และบันทึกระดับสูงสุด 200Hz)
- TACOTRON2 2 ภาษา-เรียนรู้ที่จะพูดได้อย่างคล่องแคล่วในภาษาต่างประเทศ: การสังเคราะห์คำพูดหลายภาษาและการโคลนนิ่งเสียงข้ามภาษา
- https://google.github.io/tacotron/publications/multilingual
- เวิร์นน์
- Melnet - Melnet: แบบจำลองการกำเนิดสำหรับเสียงในโดเมนความถี่
- https://audio-samples.github.io
- https://sjvasquez.github.io/blog/melnet
- การผกผันแบบสเปคโตรัม
- FastSpeech - FastSpeech: ข้อความที่รวดเร็วแข็งแกร่งและควบคุมได้เป็นคำพูด
- https://speechresearch.github.io/fastspeech
- เครื่องเป่านก
- Paranet-ข้อความประสาทแบบคู่ขนานถึงคำพูด
- https://parallel-neural-tts-demo.github.io
- Wavevae, Clarinet, Wavenet
2018
- Transformer -TTS - การสังเคราะห์เสียงพูดด้วยเครือข่ายหม้อแปลง
- https://neuraltts.github.io/transformertts
- เวนเน็ต
- Tacotron2 2- สเปคเกอร์-ถ่ายโอนการเรียนรู้จากการตรวจสอบลำโพงไปยังการสังเคราะห์ข้อความหลายข้อความเป็นคำพูด
- https://google.github.io/tacotron/publications/speaker_adaptation
- เวนเน็ต
- Tacotron2+GST-Tokens Style: การสร้างแบบจำลองสไตล์ที่ไม่ได้รับการควบคุมการควบคุมและการถ่ายโอนในการสังเคราะห์คำพูดแบบ end-to-end
- https://google.github.io/tacotron/publications/global_style_tokens
- กริฟฟิน-ลิม
2017
- TACOTRON2 - การสังเคราะห์ TTS ธรรมชาติโดยการปรับสภาพ wavenet ในการทำนาย mel spectrogram
- https://google.github.io/tacotron/publications/tacotron22
- เวนเน็ต
- Tacotron-Tacotron: ไปสู่การสังเคราะห์คำพูดแบบ end-to-end
- https://google.github.io/tacotron/publications/tacotron
- กริฟฟิน-ลิม
การบริจาค
สิ่งที่ต้องทำ