pytorch dc tts
1.0.0
Pytorch Mise en œuvre d'un système de texte à dispection efficacement formable basé sur des réseaux convolutionnels profonds avec une attention guidée basée en partie sur les projets suivants:
Les cahiers suivants sont exécutables sur https://colab.research.google.com:
Pour les échantillons audio et les modèles pré-entraînés, visitez les liens de cahier ci-dessus.
Le TTS anglais utilise l'ensemble de données LJ-Speech.
python dl_and_preprop_dataset.py --dataset=ljspeechpython train-text2mel.py --dataset=ljspeechpython train-ssrn.py --dataset=ljspeechpython synthesize.py --dataset=ljspeechsamples . Le texte vocable mongol utilise 5 heures audio de la Bible mongole.
python dl_and_preprop_dataset.py --dataset=mbspeechpython train-text2mel.py --dataset=mbspeechpython train-ssrn.py --dataset=mbspeechpython synthesize.py --dataset=mbspeechsamples .