Unduh LVCNet - Unduh Kode Sumber LVCNet

LVCNet

Kode Sumber AI

1.0.0

Unduh

LVCNET: Jaringan pemodelan yang bergantung pada kondisi yang efisien untuk pembuatan bentuk gelombang

Menggunakan LVCNET untuk merancang generator Wavegan paralel dan strategi yang sama untuk melatihnya, kecepatan inferensi vocoder baru lebih dari 5x lebih cepat daripada vocoder asli tanpa degradasi dalam kualitas audio .

Pekerjaan kami saat ini [kertas] telah diterima oleh ICASSP2021, dan karya kami sebelumnya dijelaskan dalam Mellow.

Pelatihan dan tes

Siapkan data, unduh dataset LJSpeech dari https://keithito.com/lj-sheech-dataset/, dan simpan di data/LJSpeech-1.1 . Lalu jalankan
```
 python - m vocoder . preprocess - - data - dir . / data / LJSpeech - 1.1 - - config configs / lvcgan . v1 . yaml
```
Mel-deptrum dihitung dan disimpan dalam folder temp/ .

Pelatihan LVCNET

 python - m vocoder . train - - config configs / lvcgan . v1 . yaml - - exp - dir exps / exp . lvcgan . v1

Uji lvcnet

 python - m vocoder . test - - config configs / lvcgan . v1 . yaml - - exp - dir exps / exp . lvcgan . v1

Hasil eksperimen, termasuk log pelatihan, pos pemeriksaan model dan audio yang disintesis, disimpan di folder exps/exp.lvcgan.v1/ .
Kesamaan, Anda juga dapat menggunakan configs/pwg.v1.yaml untuk melatih model Wavegan paralel.

 # training
python - m vocoder . train - - config configs / pwg . v1 . yaml - - exp - dir exps / exp . pwg . v1
# test
python - m vocoder . test - - config configs / pwg . v1 . yaml - - exp - dir exps / exp . pwg . v1

Hasil

Tensorboard

Gunakan Tensorboard untuk melihat proses pelatihan eksperimental:

 tensorboard --logdir exps

Traning Loss

gambar

Mengevaluasi kerugian

gambar

Sampel aduio

Sampel audio disimpan dalam samples/ , di mana

samples/*_lvc.wav dihasilkan oleh lvcnet,
samples/*_pwg.wav dihasilkan oleh paralel Wavegan,
samples/*_real.wav adalah audio yang sebenarnya.

Referensi

LVCNET: Jaringan pemodelan yang bergantung pada kondisi yang efisien untuk generasi bentuk gelombang, https://arxiv.org/abs/2102.10815
Melglow: Jaringan Generatif Gelombang Efisien Berdasarkan Konvolusi Lokasi-Variabel, https://arxiv.org/abs/2012.01684
https://github.com/kan-bayashi/parallelwavegan
https://github.com/lmnt-com/diffwave

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-08-22
ukuran 8.03MB
Berasal dari Github

Aplikasi Terkait

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua