Téléchargement de LightSpeech - Téléchargement du code source LightSpeech

LightSpeech

Code Source AI

1.0.0

Télécharger

Faillite

Implémentation non officielle Pytorch de LightSpeech: texte léger et rapide à la parole avec recherche d'architecture neuronale. Ce repo utilise l'implémentation FastSpeech 2 d'ESPNET comme base. Ce repo implémente uniquement la version finale du modèle LightSpeech et non la recherche d'architecture neuronale comme mentionné dans le papier.

But I am able to compress only 3x (from 27 M to 7.99 M trainable parameters) not 15x .

Exigences :

Tout le code écrit en Python 3.6.2 .

Installer Pytorch

Avant d'installer Pytorch, veuillez vérifier votre version CUDA en exécutant la commande suivante: nvcc --version

 pip install torch torchvision

Dans ce dépôt, j'ai utilisé Pytorch 1.6.0 pour la fonction torch.bucketize qui n'est pas présente dans les versions précédentes de Pytorch.

Installation d'autres exigences:

 pip install -r requirements.txt

Pour utiliser Tensorboard Installer tensorboard version 1.14.0 séparément avec tensorflow (1.14.0)

Pour le prétraitement:

Le dossier filelists contient des fichiers de données LJSpeech traités MFA (MotReal Force Aligner), vous n'avez donc pas besoin d'aligner le texte avec l'audio (pour la durée d'extrait) pour l'ensemble de données LJSpeech. Pour un autre ensemble de données, suivez l'instruction ici. Pour d'autres prétraitements Exécuter la commande suivante:

 python .nvidia_preprocessing.py -d path_of_wavs -c configs/default.yaml

Pour trouver le min et le max de F0 et de l'énergie

 python .compute_statistics.py

Mettez à jour ce qui suit dans hparams.py par min et max de F0 et de l'énergie

 p_min = Min F0/pitch
p_max = Max F0
e_min = Min energy
e_max = Max energy

Pour la formation

 python train_lightspeech.py --outdir etc -c configs/default.yaml -n "name"

Pour l'inférence

Vider

 python .inference.py -c .configsdefault.yaml -p .checkpointsfirst_1xyz.pyt --out output --text "ModuleList can be indexed like a regular Python list but modules it contains are properly registered."

Pour l'exportation de TorchScript

 python export_torchscript.py -c configs/default.yaml -n fastspeech_scrip --outdir etc

Note :

Pour plus complet et plus complet de clonage vocal ou de boîte à outils de discours (TTS)? Veuillez visiter DeepSync Technologies.

Références

LightSpeech: texte léger et rapide à la parole avec recherche d'architecture neuronale
FastSpeech 2: Texte de bout en bout rapide et de haute qualité à la parole
FastSpeech: texte rapide, robuste et contrôlable à la parole
ESPNET
Mise en œuvre de la lueur d'onde de Nvidia
Melgan
Durian
Implémentation FastSpeech2 TensorFlow
Autre implémentation Pytorch FastSpeech 2
Wavernn

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-14
taille 3.27MB
Provenant de Github

Applications connexes

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout