Téléchargement ForwardTacotron NVDA - Téléchargement du code source ForwardTacotron NVDA

ForwardTacotron NVDA

Code Source AI

1.0.0

Télécharger

Support ForwardTacotron et Hifi-Agan pour le lecteur d'écran NVDA

Remarque: Ce module complémentaire ainsi que la documentation sont toujours en construction. Vos contributions sont les bienvenues!

introduction

N'oubliez pas que ForwardTacotron est un modèle de synthèse de la parole dans Pytorch qui utilise un prédicteur de durée pour aligner le texte et générer des spectrogrammes MEL. Le modèle présente des avantages, tels que la robustesse, la vitesse, la pitch et la manipulation d'énergie et l'efficacité.

Ainsi, ce plugin est une tentative d'implémentation de la prise en charge de ForwardTacotron dans le lecteur d'écran open source de NVDA via le client / serveur, car les bibliothèques utilisées comme torch ne sont pas possibles à inclure directement dans NVDA.

Il s'agit d'un travail en cours et donc il y a encore beaucoup à faire.

En attendant, vous pouvez écouter les progrès réalisés jusqu'à présent.

échantillons audio

Langue	Voix	Échantillon
Anglais	LJSpeech (avec Griffinlim Vocoder)
Anglais	LJSpeech (avec Hifi-Goner)
Espagnol	Ensemble de données Ald (avec Hifi-GoCoder)
Espagnol	Odal (avec Hifi-gan Vocoder, modèle universel)

faire:

Un moyen de compiler et d'intégrer le serveur au module complémentaire.
- Lorsque cela se produit, permettez au serveur d'ouvrir lorsque le synthé est chargé. Une fois que le serveur se charge, nous pouvons appeler la vérification pour préparer le synthétiseur de la parole pour l'usage.
- Deux versions pourraient être faites pour le module complémentaire, avec le support CPU et un avec le support GPU, car apparemment la synthèse est générée en temps réel sur un GPU. En attendant, nous pouvons remarquer des ralentissements dans le CPU.
Support de changement de voix et d'énergie dans les options de cycle de synthé.
À l'heure actuelle, le module complémentaire utilise HTTPLIB2 pour communiquer avec le serveur, mais je pourrais rechercher d'autres méthodes et si nécessaire, réécrivez une partie du serveur.
Ajoutez une prise en charge pour le chargement de différentes voix qui pourraient être détectées dans un dossier "Voice_Models".
- Avec cela, un support pour le téléchargement de modèles formés pourrait être ajouté. Nous avons un modèle LJSpeech en anglais, un autre en allemand et deux en espagnol.
Pour les nouveaux modèles multi-orages, il peut lire les paramètres à vérifier, et si c'est le cas, il peut choisir la voix parmi les options de bague de synthé avec d'abord les noms de haut-parleur du modèle.

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-08-23
taille 2.43MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout