Descarga de FastSpeech - Descargar el código fuente de FastSpeech

Español

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

Inicio>Relacionado con la programación>Pitón

FastSpeech

Pitón

1.0.0

Descargar

FastSpeech-Pytorch

La implementación de FastSpeech basada en Pytorch.

Actualización (2020/07/20)

Optimizar el proceso de capacitación.
Optimizar la implementación del regulador de longitud.
Use el mismo parámetro Hyper que FastSpeech2.
Las medidas de los 1, 2 y 3 hacen el proceso de entrenamiento 3 veces más rápido que antes.
Mejor calidad del habla.

Modelo

Mi blog

Notas de lectura de FastSpeech
Detalles y replanteamiento de esta implementación

Preparar el conjunto de datos

Descargue y extraiga el conjunto de datos LJSPEECH.
Coloque el conjunto de datos LJSPEECH en data .
alignments.zip de descenso.zip.
Ponga el modelo de Glow de onda Pretrado de NVIDIA en el waveglow/pretrained_model y cambie el nombre de waveglow_256channels.pt ;
Ejecute python3 preprocess.py .

Capacitación

Corre python3 train.py .

Evaluación

Ejecute python3 eval.py

Notas

En el documento de FastSpeech, los autores utilizan el modelo Transformer TTS previamente capacitado para proporcionar el objetivo de alineación. No tenía un modelo Transformer-TTS bien entrenado, así que uso Tacotron2 en su lugar.
Utilizo el mismo hiper-parámetro que FastSpeech2.
Los ejemplos de audio están en sample .
modelo previo a la aparición.

Referencia

Repositorio

La implementación de Tacotron basada en TensorFlow
La implementación de Transformer basada en Pytorch
La implementación de Transformer-TTS basada en Pytorch
La implementación de Tacotron2 basada en Pytorch
La implementación de FastSpeech2 basada en Pytorch

Papel

Tacotrón2
Transformador
Espacios rápidos
FastSpeech2

Expandir

Información adicional

Versión 1.0.0
Tipo Pitón
Fecha de actualización 2025-07-12
tamaño 6.35MB
Proviene de Github

Aplicaciones relacionadas

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
Herramienta de gráficos de datos de código abierto Redash v24.10.0

2024-11-27
datamule python

2024-11-08
plataforma de visualización de datos smartchart v6.9

2024-11-27
Herramienta de prueba de carga de langosta v2.32.0

2024-11-27

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ToDo Co

Pitón

1.0.0
Python Portfolio

Pitón
Herramienta de gráficos de datos de código abierto Redash v24.10.0

Pitón

24.10.0
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo