Download da LightSpeech - Download do código fonte LightSpeech

LightSpeech

Código-Fonte de IA

1.0.0

Baixar

LightSpeech

Implementação não oficial de Pytorch da LightSpeech: texto leve e rápido para a fala com a pesquisa de arquitetura neural. Este repo usa a implementação do FastSpeech 2 do ESPNET como base. Este repo implementa apenas a versão final do modelo LightSpeech, não a pesquisa de arquitetura neural, conforme mencionado no papel.

But I am able to compress only 3x (from 27 M to 7.99 M trainable parameters) not 15x .

Requisitos:

Todo o código escrito no Python 3.6.2 .

Instale o pytorch

Antes de instalar o Pytorch, verifique sua versão CUDA executando o seguinte comando: nvcc --version

 pip install torch torchvision

Neste repo, usei Pytorch 1.6.0 para o recurso torch.bucketize , que não está presente nas versões anteriores do Pytorch.

Instalando outros requisitos:

 pip install -r requirements.txt

Para usar o Tensorboard Instalar tensorboard version 1.14.0 Seperatly com tensorflow (1.14.0)

Para pré -processamento:

A pasta filelists contém os arquivos de conjunto de dados LJSpeech MFA (Moteal Force Aligner), para que você não precise alinhar texto com áudio (para duração de extração) para o conjunto de dados LJSpeech. Para outro conjunto de dados, siga as instruções aqui. Para outros pré-processamento de execução seguindo o comando:

 python .nvidia_preprocessing.py -d path_of_wavs -c configs/default.yaml

Para encontrar o min e o máximo de f0 e energia

 python .compute_statistics.py

Atualize o seguinte em hparams.py por min e max de f0 e energia

 p_min = Min F0/pitch
p_max = Max F0
e_min = Min energy
e_max = Max energy

Para treinamento

 python train_lightspeech.py --outdir etc -c configs/default.yaml -n "name"

Para inferência

WIP

 python .inference.py -c .configsdefault.yaml -p .checkpointsfirst_1xyz.pyt --out output --text "ModuleList can be indexed like a regular Python list but modules it contains are properly registered."

Para exportação de tochota

 python export_torchscript.py -c configs/default.yaml -n fastspeech_scrip --outdir etc

Observação :

Para uma caixa de ferramentas mais completa e de ponta a ponta a ponta a ponta ou texto da Speech (TTS)? Visite as tecnologias DeepSync.

Referências

LightSpeech: texto leve e rápido para a fala com pesquisa de arquitetura neural
FastSpeech 2: texto de ponta a ponta rápido e de alta qualidade para a fala
FastSpeech: texto rápido, robusto e controlável para a fala
ESPNET
Implementação de Glow Waveglow da NVIDIA
Melgan
Durian
Implementação do FastSpeech2 TensorFlow
Outra implementação de Pytorch FastSpeech 2
Wavernn

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-14
tamanho 3.27MB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos