Unduh AutoVocoder - Unduh Kode Sumber AutoVocoder

AutoVocoder

Kode Sumber AI

1.0.0

Unduh

Autovocoder: Generasi bentuk gelombang cepat dari representasi ucapan yang dipelajari menggunakan pemrosesan sinyal digital yang dapat dibedakan

Implementasi Autovocoder Pytorch Tidak Resmi: Generasi Gelombang Cepat dari Representasi Pidato yang Dipelajari Menggunakan Pemrosesan Sinyal Digital yang Dapat Diferensial. Repositori ini didasarkan pada ISTFTNET GITHUB (kertas) .

Disclaimer : This repo is built for testing purpose.

Pelatihan :

 python train.py --config config.json

Dalam train.py , ubah --input_wavs_dir ke direktori ljspeech-1.1/wavs.
Di config.json , ubah latent_dim untuk AV128 , AV192 , dan AV256 (default).
Mempertimbangkan Section 3.3 , Anda dapat memilih dec_istft_input antara cartesian (default), polar , dan both .

Catatan:

Kehilangan validasi AV256 selama pelatihan.
Dalam tes kami, itu menyatu hampir 3x kali lebih cepat dari HIFI-V1 (mengacu pada repo resmi).

Kutipan:

 @article{Webber2022AutovocoderFW,
  title={Autovocoder: Fast Waveform Generation from a Learned Speech Representation using Differentiable Digital Signal Processing},
  author={Jacob J. Webber and Cassia Valentini-Botinhao and Evelyn Williams and Gustav Eje Henter and Simon King},
  journal={ArXiv},
  year={2022},
  volume={abs/2211.06989}
}