Remarque: Ce module complémentaire ainsi que la documentation sont toujours en construction. Vos contributions sont les bienvenues!
N'oubliez pas que ForwardTacotron est un modèle de synthèse de la parole dans Pytorch qui utilise un prédicteur de durée pour aligner le texte et générer des spectrogrammes MEL. Le modèle présente des avantages, tels que la robustesse, la vitesse, la pitch et la manipulation d'énergie et l'efficacité.
Ainsi, ce plugin est une tentative d'implémentation de la prise en charge de ForwardTacotron dans le lecteur d'écran open source de NVDA via le client / serveur, car les bibliothèques utilisées comme torch ne sont pas possibles à inclure directement dans NVDA.
Il s'agit d'un travail en cours et donc il y a encore beaucoup à faire.
En attendant, vous pouvez écouter les progrès réalisés jusqu'à présent.
| Langue | Voix | Échantillon |
|---|---|---|
| Anglais | LJSpeech (avec Griffinlim Vocoder) | |
| Anglais | LJSpeech (avec Hifi-Goner) | |
| Espagnol | Ensemble de données Ald (avec Hifi-GoCoder) | |
| Espagnol | Odal (avec Hifi-gan Vocoder, modèle universel) |