Descargar Tacotron pytorch - Descargar el código fuente de Tacotron pytorch

Tacotron pytorch

Código Fuente de IA

1.0.0

Descargar

Tacotron-pytorch

Una implementación de Pytorch de Tacotron: un modelo de síntesis de texto a discurso de extremo a extremo.

Requisitos

Instalar Python 3
Instalar pytorch == 0.2.0
Requisitos de instalación:
```
 pip install -r requirements.txt
```

Datos

Utilicé el conjunto de datos LJSPEECch que consiste en pares de script de texto y archivos WAV. El conjunto de datos completo (13,100 pares) se puede descargar aquí. Referí https://github.com/keithito/tacotron para el código de preprocesamiento.

Descripción del archivo

hyperparams.py incluye todos los parámetros Hyper que se necesitan.
data.py Carga datos de entrenamiento y texto preprocesado para indexar y WAV archivos al espectrograma. Los códigos de preprocesamiento para el texto están en texto/ directorio.
module.py contiene todos los métodos, incluidos CBHG, Highway, Prenet, etc.
network.py contiene redes que incluyen el codificador, el decodificador y la red de postprocesamiento.
train.py es para entrenamiento.
synthesis.py es para generar una muestra TTS.

Entrenando la red

Paso 1. Descargue y extraiga los datos de LJSpeech en cualquier directorio que desee.
Paso 2. Ajuste los hiperparámetros en hyperparams.py , especialmente 'data_path', que es un directorio que extrae archivos, y los demás si es necesario.
Paso 3. Ejecute train.py .

Generar archivo WAV TTS

Paso 1. Ejecute synthesis.py . Asegúrese de que el paso de restauración.

Muestras

Puede verificar las muestras generadas en el directorio 'Muestras/'. El paso de entrenamiento fue de solo 60k, por lo que el rendimiento aún no es bueno.