melgan neurips Téléchargement - melgan neurips Source Téléchargement du code

melgan neurips

Python

1.0.0

Télécharger

Référentiel officiel pour le papier MELGAN: réseaux adversaires génératifs pour la synthèse de la forme d'onde conditionnelle

Des travaux antérieurs ont montré que la génération de formes d'onde audio brutes cohérentes avec GANS est difficile. Dans cet article, nous montrons qu'il est possible de former des Gans de manière fiable à générer des formes d'onde cohérentes de haute qualité en introduisant un ensemble de changements architecturaux et de techniques de formation simples. La métrique d'évaluation subjective (score d'opinion moyen, ou MOS) montre l'efficacité de l'approche proposée pour l'inversion du spectrogramme de MEL de haute qualité. Pour établir la généralité des techniques proposées, nous montrons des résultats qualitatifs de notre modèle en synthèse de la parole, de la traduction du domaine musical et de la synthèse musicale inconditionnelle. Nous évaluons les différentes composantes du modèle à travers des études d'ablation et suggérons un ensemble de lignes directrices pour concevoir des discriminateurs et des générateurs à usage général pour les tâches de synthèse de séquence conditionnelle. Notre modèle est non autorégressif, entièrement convolutionnel, avec beaucoup moins de paramètres que les modèles concurrents et se généralise aux haut-parleurs invisibles pour l'inversion du spectrogramme de MEL. Notre implémentation Pytorch s'exécute à plus de 100x plus rapidement que en temps réel sur GTX 1080TI GPU et plus de 2x plus rapidement que en temps réel sur CPU, sans aucun astuce d'optimisation spécifique au matériel. Article de blog avec des échantillons et le code qui l'accompagne à venir bientôt.

Visitez notre site Web pour des échantillons. Vous pouvez essayer l'application de correction de la parole ici créée sur la base du pipeline de synthèse de la parole de bout en bout à l'aide de MELGAN.

Vérifiez les diapositives si vous n'assistez pas à la conférence des Neirips 2019 pour consulter notre affiche.

Organisation de code

 ├── README.md             <- Top-level README.
├── set_env.sh            <- Set PYTHONPATH and CUDA_VISIBLE_DEVICES.
│
├── mel2wav
│   ├── dataset.py           <- data loader scripts
│   ├── modules.py           <- Model, layers and losses
│   ├── utils.py             <- Utilities to monitor, save, log, schedule etc.
│
├── scripts
│   ├── train.py                    <- training / validation / etc scripts
│   ├── generate_from_folder.py

Préparation d'un ensemble de données

Créez un dossier brut avec tous les échantillons stockés dans wavs/ sous-dossier. Exécutez ces commandes:

ls wavs/ * .wav | tail -n+10 > train_files.txt
ls wavs/ * .wav | head -n10 > test_files.txt

Exemple de formation

 . source set_env.sh 0
# Set PYTHONPATH and use first GPU
python scripts/train.py --save_path logs/baseline --path <root_data_folder>

Exemple Pytorch Hub

 import torch
vocoder = torch.hub.load('descriptinc/melgan-neurips', 'load_melgan')
vocoder.inverse(audio)  # audio (torch.tensor) -> (batch_size, 80, timesteps)

Développer

Informations supplémentaires

Version 1.0.0
Type Python
Date de mise à jour 2025-07-12
taille 33.51MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ToDo Co

Python

1.0.0
Python Portfolio

Python
Outil de création de graphiques de données open source Redash v24.10.0

Python

24.10.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout