Descarga LightSpeech - Descargar el código fuente LightSpeech

LightSpeech

Código Fuente de IA

1.0.0

Descargar

Expediente de luz

Implementación no oficial de Pytorch de discurso de luz: texto liviano y rápido a discurso con búsqueda de arquitectura neuronal. Este repositorio utiliza la implementación de FastSpeech 2 de ESPNet como base. Este repositorio solo implementa la versión final del modelo LightSpeech, no la búsqueda de arquitectura neuronal como se menciona en el papel.

But I am able to compress only 3x (from 27 M to 7.99 M trainable parameters) not 15x .

Requisitos:

Todo el código escrito en Python 3.6.2 .

Instalar pytorch

Antes de instalar Pytorch, consulte su versión CUDA ejecutando el siguiente comando: nvcc --version

 pip install torch torchvision

En este repositorio he usado Pytorch 1.6.0 para la función torch.bucketize que no está presente en versiones anteriores de Pytorch.

Instalación de otros requisitos:

 pip install -r requirements.txt

Para usar TensorBoard, instale tensorboard version 1.14.0 por separado con tensorflow (1.14.0)

Para el preprocesamiento:

La carpeta filelists contiene MFA (Motreal Force Aligner) Archivos de conjunto de datos LJSPEECH procesados para que no necesite alinear texto con audio (para duración de extracto) para el conjunto de datos LJSPEECH. Para otro conjunto de datos, siga la instrucción aquí. Para otro comando de ejecución previa al procesamiento:

 python .nvidia_preprocessing.py -d path_of_wavs -c configs/default.yaml

Para encontrar el min y el máximo de F0 y la energía

 python .compute_statistics.py

Actualice lo siguiente en hparams.py por min y máximo de F0 y energía

 p_min = Min F0/pitch
p_max = Max F0
e_min = Min energy
e_max = Max energy

Para el entrenamiento

 python train_lightspeech.py --outdir etc -c configs/default.yaml -n "name"

Por inferencia

Ceñudo

 python .inference.py -c .configsdefault.yaml -p .checkpointsfirst_1xyz.pyt --out output --text "ModuleList can be indexed like a regular Python list but modules it contains are properly registered."

Para la exportación de antorchscript

 python export_torchscript.py -c configs/default.yaml -n fastspeech_scrip --outdir etc

Nota :

¿Para una caja de herramientas de clonación o texto de voz o texto más completa y final? Visite DeepSync Technologies.

Referencias

Expecha de luz: texto liviano y rápido al habla con búsqueda de arquitectura neuronal
FastSpeech 2: texto de extremo a extremo rápido y de alta calidad al habla
FastSpeech: texto rápido, robusto y controlable al habla
ESPNET
Implementación de Glow de Nvidia
Melgan
Durian
Implementación de FastSpeech2 TensorFlow
Otra implementación de Pytorch FastSpeech 2
Wavernn

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-14
tamaño 3.27MB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo