Unduhan melgan neurips - Unduh Kode Sumber melgan neurips

melgan neurips

ular piton

1.0.0

Unduh

Repositori Resmi untuk Kertas Melgan: Jaringan permusuhan generatif untuk sintesis bentuk gelombang bersyarat

Karya -karya sebelumnya telah menemukan bahwa menghasilkan bentuk gelombang audio mentah yang koheren dengan GANS menantang. Dalam makalah ini, kami menunjukkan bahwa dimungkinkan untuk melatih GANS dengan andal untuk menghasilkan bentuk gelombang koheren berkualitas tinggi dengan memperkenalkan serangkaian perubahan arsitektur dan teknik pelatihan sederhana. Metrik evaluasi subyektif (skor opini rata-rata, atau MOS) menunjukkan efektivitas pendekatan yang diusulkan untuk inversi Mel-spectrogram berkualitas tinggi. Untuk menetapkan umumnya teknik yang diusulkan, kami menunjukkan hasil kualitatif dari model kami dalam sintesis ucapan, terjemahan domain musik dan sintesis musik tanpa syarat. Kami mengevaluasi berbagai komponen model melalui studi ablasi dan menyarankan serangkaian pedoman untuk merancang diskriminator tujuan umum dan generator untuk tugas sintesis urutan bersyarat. Model kami adalah non-autoregresif, sepenuhnya konvolusional, dengan parameter yang secara signifikan lebih sedikit daripada model yang bersaing dan menggeneralisasi ke speaker yang tidak terlihat untuk inversi Mel-Spectrogram. Implementasi PyTorch kami berjalan lebih dari 100x lebih cepat daripada realtime pada GPU GTX 1080TI dan lebih dari 2x lebih cepat daripada real-time pada CPU, tanpa trik optimasi khusus perangkat keras. Posting blog dengan sampel dan kode yang menyertainya segera hadir.

Kunjungi situs web kami untuk sampel. Anda dapat mencoba aplikasi Koreksi Bicara di sini yang dibuat berdasarkan pipa sintesis ucapan end-to-end menggunakan Melgan.

Periksa slide jika Anda tidak menghadiri konferensi Neurips 2019 untuk memeriksa poster kami.

Organisasi Kode

 ├── README.md             <- Top-level README.
├── set_env.sh            <- Set PYTHONPATH and CUDA_VISIBLE_DEVICES.
│
├── mel2wav
│   ├── dataset.py           <- data loader scripts
│   ├── modules.py           <- Model, layers and losses
│   ├── utils.py             <- Utilities to monitor, save, log, schedule etc.
│
├── scripts
│   ├── train.py                    <- training / validation / etc scripts
│   ├── generate_from_folder.py

Mempersiapkan dataset

Buat folder mentah dengan semua sampel yang disimpan di wavs/ Subfolder. Jalankan perintah ini:

ls wavs/ * .wav | tail -n+10 > train_files.txt
ls wavs/ * .wav | head -n10 > test_files.txt

Contoh pelatihan

 . source set_env.sh 0
# Set PYTHONPATH and use first GPU
python scripts/train.py --save_path logs/baseline --path <root_data_folder>

Contoh Hub Pytorch

 import torch
vocoder = torch.hub.load('descriptinc/melgan-neurips', 'load_melgan')
vocoder.inverse(audio)  # audio (torch.tensor) -> (batch_size, 80, timesteps)

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe ular piton
Waktu Pembaruan 2025-07-12
ukuran 33.51MB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ToDo Co

ular piton

1.0.0
Python Portfolio

ular piton
datamule python

ular piton
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua