Descarga de AutoVocoder - Descargar el código fuente AutoVocoder

AutoVocoder

Código Fuente de IA

1.0.0

Descargar

Autovocoder: generación de forma de onda rápida a partir de una representación del habla aprendida utilizando un procesamiento de señal digital diferenciable

Implementación no oficial de Pytorch de Autovocoder: generación de forma de onda rápida a partir de una representación del habla aprendida utilizando un procesamiento de señal digital diferenciable. Este repositorio se basa en Istftnet GitHub (papel) .

Disclaimer : This repo is built for testing purpose.

Capacitación :

 python train.py --config config.json

En train.py , cambie --input_wavs_dir al directorio de LJSPEECH-1.1/WAVS.
En config.json , cambie latent_dim para AV128 , AV192 y AV256 (predeterminado).
Teniendo en cuenta Section 3.3 , puede seleccionar dec_istft_input entre cartesian (predeterminado), polar y both .

Nota:

Pérdida de validación de AV256 durante el entrenamiento.
En nuestra prueba, converge casi 3 veces más rápido que Hifi-V1 (refiriéndose al repositorio oficial).

Citas:

 @article{Webber2022AutovocoderFW,
  title={Autovocoder: Fast Waveform Generation from a Learned Speech Representation using Differentiable Digital Signal Processing},
  author={Jacob J. Webber and Cassia Valentini-Botinhao and Evelyn Williams and Gustav Eje Henter and Simon King},
  journal={ArXiv},
  year={2022},
  volume={abs/2211.06989}
}