Luar biasa-tts-sampel
Daftar makalah TTS dengan sampel audio yang disediakan oleh penulis. Baris terakhir dari setiap kertas menunjukkan inversi spektrogram (vocoder) yang digunakan.
Untuk daftar makalah TTS penting yang lebih komprehensif, saya merekomendasikan membaca xcmyz/kertas-sintesis-kertas yang ditulis oleh Zhengxi Liu.
2020
- FastPitch-FastPitch: Teks-ke-Speech Paralel dengan Prediksi Pitch
- https://fastpitch.github.io/
- Waveglow
- Eats-Text-to-speech end-to-end-end
- https://deepmind.com/research/publications/end-to-end-adversarial-text-to-speech
- Model ujung ke ujung
- Glow-Tts-Glow-TTS: Aliran generatif untuk teks-ke-speech melalui pencarian perataan monotonik
- https://jaywalnut310.github.io/glow-tts-demo
- Waveglow
- Flowtron-Flowtron: Jaringan generatif berbasis aliran autoregresif untuk sintesis teks-ke-pidato
- https://nv-adlr.github.io/flowtron
- Waveglow
2019
- TACOTRON2+DCA-Lokasi-relatif mekanisme perhatian untuk sintesis wicara panjang yang kuat
- https://google.github.io/tacotron/publications/location_relative_attention
- Wavernn
- GAN -TTS - Sintesis Pidato Kesetiaan Tinggi dengan Jaringan Perselisihan
- https://storage.googleapis.com/deepmind-media/research/abstract.wav
- Model end-to-end (dibangun di atas fitur Linguistic & Log Pitch 200Hz)
- Tacotron2 multi-bahasa-Belajar berbicara dengan lancar dalam bahasa asing: sintesis ucapan multibahasa dan kloning suara lintas bahasa
- https://google.github.io/tacotron/publications/multilingual
- Wavernn
- Melnet - Melnet: Model generatif untuk audio di domain frekuensi
- https://audio-samples.github.io
- https://sjvasquez.github.io/blog/melnet
- Inversi spektrogram berbasis gradien
- FastSpeech - FastSpeech: Teks cepat, kuat dan dapat dikendalikan untuk diucapkan
- https://speechresearch.github.io/fastspeech
- Waveglow
- PARANET-Teks Saraf Paralel-ke-Pidato
- https://parallel-neural-tts-demo.github.io
- Wavevae, Clarinet, Wavenet
2018
- Transformer -TTS - Sintesis Bicara Saraf dengan Transformer Network
- https://neuraltts.github.io/transformertts
- Wavenet
- Multi-speaker Tacotron2-Transfer pembelajaran dari verifikasi speaker ke sintesis teks-ke-speech multispeaker
- https://google.github.io/tacotron/publications/speaker_adaptation
- Wavenet
- TACOTRON2+GST-Token Gaya: Pemodelan Gaya Tanpa Pengawasan, Kontrol, dan Transfer dalam Sintesis Pidato End-to-End
- https://google.github.io/tacotron/publications/global_style_tokens
- Griffin-Lim
2017
- TACOTRON2 - Sintesis TTS Alami dengan mengkondisikan Wavenet pada prediksi spektrogram MEL
- https://google.github.io/tacotron/publications/tacotron2
- Wavenet
- Tacotron-Tacotron: Menuju Sintesis Pidato End-to-End
- https://google.github.io/tacotron/publications/tacotron
- Griffin-Lim
Berkontribusi
Todo