Tacotron pytorch
1.0.0
Uma implementação de tacotron pytorch: um modelo de síntese de texto para fala de ponta a ponta.

pip install -r requirements.txt
Usei o conjunto de dados LJSpeech, que consiste em pares de script de texto e arquivos WAV. O conjunto de dados completo (13.100 pares) pode ser baixado aqui. Referi -me https://github.com/keithito/tacotron para o código de pré -processamento.
hyperparams.py inclui todos os hiper parâmetros necessários.data.py carrega dados de treinamento e texto pré -processado para indexar e os arquivos WAV no Spectrogram. Os códigos de pré -processamento para texto estão no texto/ diretório.module.py contém todos os métodos, incluindo CBHG, Highway, PreNet e assim por diante.network.py contém redes, incluindo codificador, decodificador e rede de pós-processamento.train.py é para treinamento.synthesis.py é para gerar amostra TTS. hyperparams.py , especialmente 'data_path', que é um diretório que você extrai arquivos e os outros, se necessário.train.py synthesis.py . Verifique se a etapa da restauração.