Download do Tacotron pytorch - Tacotron pytorch Download do código -fonte

Tacotron pytorch

Código-Fonte de IA

1.0.0

Baixar

Tacotron-Pytorch

Uma implementação de tacotron pytorch: um modelo de síntese de texto para fala de ponta a ponta.

Requisitos

Instale o Python 3
Instale pytorch == 0.2.0
Instalar requisitos:
```
 pip install -r requirements.txt
```

Dados

Usei o conjunto de dados LJSpeech, que consiste em pares de script de texto e arquivos WAV. O conjunto de dados completo (13.100 pares) pode ser baixado aqui. Referi -me https://github.com/keithito/tacotron para o código de pré -processamento.

Descrição do arquivo

hyperparams.py inclui todos os hiper parâmetros necessários.
data.py carrega dados de treinamento e texto pré -processado para indexar e os arquivos WAV no Spectrogram. Os códigos de pré -processamento para texto estão no texto/ diretório.
module.py contém todos os métodos, incluindo CBHG, Highway, PreNet e assim por diante.
network.py contém redes, incluindo codificador, decodificador e rede de pós-processamento.
train.py é para treinamento.
synthesis.py é para gerar amostra TTS.

Treinando a rede

Etapa 1. Download e extrair dados LJSpeech em qualquer diretório desejar.
Etapa 2. Ajuste os hiperparâmetros em hyperparams.py , especialmente 'data_path', que é um diretório que você extrai arquivos e os outros, se necessário.
Etapa 3. Execute train.py