Téléchargement Chinese FastSpeech2 - Téléchargement du code source Chinese FastSpeech2

Chinese FastSpeech2

Code Source AI

1.0.0

Télécharger

Chinois-fastspeech2

Sur la base des données vocales féminines standard de Biaobei Chinois, le modèle FastSpeech2 de l'article d'origine a été amélioré, et le module de représentation rythmique et de prédiction du rythme a été introduit pour rendre la prononciation chinoise plus vive et rythmique

Mise à jour 20230402

1. Ajouter le code de formation du modèle rythmique, dans le répertoire de BertProsody
2. Ajouter le code de prétraitement pour la formation du modèle rythmique (pour les données de coquille standard, le code n'a pas été trié, première version), dans PRÉPROCESSEUR / BIAOBEI.PY

Échantillon

Reportez-vous à l'audio généré dans des échantillons

Fichier de modèle

La structure principale de ce projet est la structure FastSpeech2 + Hifigan. De plus, le vecteur rythmique du texte chinois est introduit au stade d'entrée. Par conséquent, il existe trois modèles: FastSpeech_Model, HIFIGAN_MODEL, Prosody_Model (lien de disque net, code d'extraction: QGPI). Après le téléchargement, placez le fichier modèle dans le répertoire spécifié:

8000.PTH.TAR ---> OUTPUT / CKPT / BIAOBEI /
générateur_universal.pth.tar ---> HIFIGAN /
best_model.pt ---> transformateur / prosody_model /

prédire

Deux méthodes de prédiction sont fournies: 1) Python synthétisé_all.py; 2) Appel d'interface HTTP

La première méthode est interactive . Après l'exécution de Python synthesize_all.py sur la ligne de commande, entrez le texte qui doit être converti. Après l'exécution, le fichier tmp.wav sera généré dans le code dans le répertoire de travail actuel;
La deuxième méthode consiste à appeler l'API , exécuter tts_server.py, qui démarrera l'interface vocale à texte. Si vous appelez cette interface, vous pouvez vous référer à TestServer.py. Le même fichier audio généré (TMP.WAV) sera enregistré dans le répertoire de travail actuel.

former

Étant donné que ce projet fait référence au projet FastSpeech2, si vous souhaitez personnaliser la formation, le projet fournit une méthode de formation plus détaillée pour référence;
Ce projet a fait quelques optimisations à la méthode d'origine. Pour la partie d'optimisation, veuillez vous référer au blog: synthèse de la parole chinoise basée sur l'optimisation FastSpeech2

Ce projet est une tentative de faire de la synthèse de la parole des intérêts personnels. Tout le monde est invité à critiquer et à me corriger et à communiquer plus!

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-08-24
taille 5.43MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Version officielle du code source du projet de jeux DOS chinois (jeux DOS chinois dans le navigateur)

2022-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout