Téléchargement FCL taco2 - Téléchargement du code source FCL taco2

FCL taco2

Code Source AI

1.0.0

Télécharger

FCL-TACO2: Vers le papier à synthèse de texte à dispection rapide, contrôlable et léger (ICASSP 2021) | Démo

Diagramme de blocs de FCL-TACO2, où le décodeur génère des spectrogrammes de MEL en mode AR dans chaque phonème et est partagé pour tous les phonèmes.

Environnement

Python 3.6.10
torche 1.3.1
Chainer 6.0.0
ESPNET 8.0.0
Apex 0.1
Numpy 1.19.1
Kaldiio 2.15.1
Librosa 0.8.0

Formation et inférence:

Étape 1. Préparation des données et prétraitement

Télécharger LJSpeech
Déballer LJSpeech-1.1.tar.bz2 vers /xx/ljSpeech-1.1
Obtenez les informations d'alignement forcées à l'aide de l'outil d'aligneur forcé Montréal. Ou vous pouvez télécharger nos résultats d'alignement, puis le déballer sur / xx / textgrid
Prétraitez l'ensemble de données pour extraire les spectrogrammes de MEL, la durée des phonèmes, la hauteur, l'énergie et la séquence de phonèmes par:
```
 python preprocessing.py --data-root /xx/LJSpeech-1.1 --textgrid-root /xx/TextGrid
```

Étape2. Formation modèle

Modèle de professeur de formation FCL-TACO2-T:
```
 ./teacher_model_training.sh
```
Formation du modèle étudiant FCL-TACO2-S:
```
 ./student_model_training.sh
```
Formation de vocodeur parallèle-Wavegan: Suivez les instructions ici. Vous pouvez également télécharger le Vocoder PWG pré-formé et mettre le modèle PWG sous le répertoire "Vocoder".

Étape 3. Évaluation du modèle

Évaluation FCL-TACO2-T:
```
 ./inference_teacher.sh
```
Évaluation FCL-TACO2-S:
```
 ./inference_student.sh
```

Citation

Si le code est utilisé dans vos recherches, veuillez jouer notre dépôt et citer notre article:

 @inproceedings{wang2021fcl,
  title={Fcl-Taco2: Towards Fast, Controllable and Lightweight Text-to-Speech Synthesis},
  author={Wang, Disong and Deng, Liqun and Zhang, Yang and Zheng, Nianzu and Yeung, Yu Ting and Chen, Xiao and Liu, Xunying and Meng, Helen},
  booktitle={ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)},
  pages={5714--5718},
  year={2021},
  organization={IEEE}
}

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-08-23
taille 228.8KB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout