pytorch dc tts
1.0.0
Implementación de Pytorch del sistema de texto a voz eficiente y capacitable basado en redes convolucionales profundas con atención guiada basada parcialmente en los siguientes proyectos:
Los siguientes cuadernos son ejecutables en https://colab.research.google.com:
Para muestras de audio y modelos previos a los pretrados, visite los enlaces de cuaderno anteriores.
El TTS en inglés utiliza el conjunto de datos de voz de LJ.
python dl_and_preprop_dataset.py --dataset=ljspeechpython train-text2mel.py --dataset=ljspeechpython train-ssrn.py --dataset=ljspeechpython synthesize.py --dataset=ljspeechsamples . El texto a la discurso de Mongolia utiliza un audio de 5 horas de la Biblia Mongolia.
python dl_and_preprop_dataset.py --dataset=mbspeechpython train-text2mel.py --dataset=mbspeechpython train-ssrn.py --dataset=mbspeechpython synthesize.py --dataset=mbspeechsamples .