Unduhan awesome tts samples - unduhan kode sumber awesome tts samples

awesome tts samples

Kode Sumber AI

1.0.0

Unduh

Luar biasa-tts-sampel

Daftar makalah TTS dengan sampel audio yang disediakan oleh penulis. Baris terakhir dari setiap kertas menunjukkan inversi spektrogram (vocoder) yang digunakan.

Untuk daftar makalah TTS penting yang lebih komprehensif, saya merekomendasikan membaca xcmyz/kertas-sintesis-kertas yang ditulis oleh Zhengxi Liu.

2020

FastPitch-FastPitch: Teks-ke-Speech Paralel dengan Prediksi Pitch
- https://fastpitch.github.io/
- Waveglow
Eats-Text-to-speech end-to-end-end
- https://deepmind.com/research/publications/end-to-end-adversarial-text-to-speech
- Model ujung ke ujung
Glow-Tts-Glow-TTS: Aliran generatif untuk teks-ke-speech melalui pencarian perataan monotonik
- https://jaywalnut310.github.io/glow-tts-demo
- Waveglow
Flowtron-Flowtron: Jaringan generatif berbasis aliran autoregresif untuk sintesis teks-ke-pidato
- https://nv-adlr.github.io/flowtron
- Waveglow

2019

TACOTRON2+DCA-Lokasi-relatif mekanisme perhatian untuk sintesis wicara panjang yang kuat
- https://google.github.io/tacotron/publications/location_relative_attention
- Wavernn
GAN -TTS - Sintesis Pidato Kesetiaan Tinggi dengan Jaringan Perselisihan
- https://storage.googleapis.com/deepmind-media/research/abstract.wav
- Model end-to-end (dibangun di atas fitur Linguistic & Log Pitch 200Hz)
Tacotron2 multi-bahasa-Belajar berbicara dengan lancar dalam bahasa asing: sintesis ucapan multibahasa dan kloning suara lintas bahasa
- https://google.github.io/tacotron/publications/multilingual
- Wavernn
Melnet - Melnet: Model generatif untuk audio di domain frekuensi
- https://audio-samples.github.io
- https://sjvasquez.github.io/blog/melnet
- Inversi spektrogram berbasis gradien
FastSpeech - FastSpeech: Teks cepat, kuat dan dapat dikendalikan untuk diucapkan
- https://speechresearch.github.io/fastspeech
- Waveglow
PARANET-Teks Saraf Paralel-ke-Pidato
- https://parallel-neural-tts-demo.github.io
- Wavevae, Clarinet, Wavenet

2018

Transformer -TTS - Sintesis Bicara Saraf dengan Transformer Network
- https://neuraltts.github.io/transformertts
- Wavenet
Multi-speaker Tacotron2-Transfer pembelajaran dari verifikasi speaker ke sintesis teks-ke-speech multispeaker
- https://google.github.io/tacotron/publications/speaker_adaptation
- Wavenet
TACOTRON2+GST-Token Gaya: Pemodelan Gaya Tanpa Pengawasan, Kontrol, dan Transfer dalam Sintesis Pidato End-to-End
- https://google.github.io/tacotron/publications/global_style_tokens
- Griffin-Lim

2017

TACOTRON2 - Sintesis TTS Alami dengan mengkondisikan Wavenet pada prediksi spektrogram MEL
- https://google.github.io/tacotron/publications/tacotron2
- Wavenet
Tacotron-Tacotron: Menuju Sintesis Pidato End-to-End
- https://google.github.io/tacotron/publications/tacotron
- Griffin-Lim