pytorch dc tts
1.0.0
Implementasi PyTorch dari sistem teks-ke-speech yang dapat dilatih secara efisien berdasarkan jaringan konvolusional yang mendalam dengan perhatian yang dipandu sebagian berdasarkan pada proyek-proyek berikut:
Notebook berikut dapat dieksekusi di https://colab.research.google.com:
Untuk sampel audio dan model pretrained, kunjungi tautan notebook di atas.
Bahasa Inggris TTS menggunakan dataset LJ-Speech.
python dl_and_preprop_dataset.py --dataset=ljspeechpython train-text2mel.py --dataset=ljspeechpython train-ssrn.py --dataset=ljspeechpython synthesize.py --dataset=ljspeechsamples . The Mongolian Text-to-Speech menggunakan 5 jam audio dari Alkitab Mongolia.
python dl_and_preprop_dataset.py --dataset=mbspeechpython train-text2mel.py --dataset=mbspeechpython train-ssrn.py --dataset=mbspeechpython synthesize.py --dataset=mbspeechsamples .