tf_multispeakerTTS_fc Télécharger - tf_multispeakerTTS

tf_multispeakerTTS_fc

Code Source AI

1.0.0

Télécharger

Synthèse de la parole multispeaker avec contrainte de rétroaction de la conférencière Vérificaiton

Il s'agit d'une implémentation TensorFlow du réseau TTS multispeaker introduit dans l'article de la vérification des haut-parleurs à la synthèse de la parole multipseaker, transfert en profondeur avec contrainte de rétroaction. Ce référentiel contient également un modèle de vérification de haut-parleur profond qui est utilisé dans le modèle TTS multi-haut-parleurs comme réseau de rétroaction. Des échantillons synthétisés sont fournis en ligne.

Citation

 @inproceedings{Cai2020,
  author={Zexin Cai and Chuxiong Zhang and Ming Li},
  title={{From Speaker Verification to Multispeaker Speech Synthesis, Deep Transfer with Feedback Constraint}},
  year=2020,
  booktitle={Proc. Interspeech 2020}
}

Architecture modèle

où le réseau d'intégration de haut-parleurs est un réseau basé sur Resnet:

Entraînement

Modèle de vérification des conférenciers

Le modèle de vérification du haut-parleur est situé dans le répertoire Deep_speaker. Par défaut par défaut, le modèle de vérification des haut-parleurs est formé avec Data Voxceleb 1 et Voxceleb 2. Vous pouvez trouver la liste de fichiers dans le répertoire. Les hyperparamètres sont définis dans vox12_hparams.py.

Pour former le modèle Vérificait de haut-parleur à partir de zéro, préparez les données répertoriées dans la liste des fichiers et exécutez:

CUDA_VISIBLE_DEVICES=0 python train.py

Synthétiseur TTS (sans contrôle de rétroaction)

Par défaut par défaut, le synthétiseur est formé à l'aide de DataSet VCTK.

Extraire la fonction audio à l'aide de process_audio.ipynb
Extraire les incorporations du haut-parleur à l'aide d'Ipython Notebook Deep_speaker / get_gvector.ipynb

Former un système TTS multispeaker de base

CUDA_VISIBLE_DEVICES=0 python synthesizer_train.py vctk datasets/vctk/synthesizer

N'hésitez pas à évaluer et à synthétiser des échantillons à l'aide de syn.ipynb pendant la formation

Neural Vocoder (Wavernn)

Par défaut par défaut, le vocodeur est également formé à l'aide de DataSet VCTK. Il serait facile après la fonctionnalité acoustique extraite de la section précédente ( synthétiseur TTS ). Pour de meilleures performances, veuillez utiliser le spectrogramme MEL GTA obtenu par vocoder_preprocess.py une fois la formation du synthétiseur terminé.

CUDA_VISIBLE_DEVICES=0 python vocoder_train.py -g --syn_dir datasets/vctk/synthesizer vctk datasets/vctk

Synthétiseur TTS avec contrainte de rétroaction

Définissez le chemin d'accès aux deux modèles pré-entraînés (le modèle de vérification du haut-parleur et le synthétiseur multipakeur) en modifiant les touches correspondantes dans hparams.py.
Former le modèle et évaluer à tout moment avec Feedback_Syn.ipynb
```
CUDA_VISIBLE_DEVICES=0 python fc_synthesizer_train.py
```

Modèles de pré-entraînement

Réseau d'incorporation de haut-parleurs
Synthétiseur de base 1 (utilisé comme modèle pré-entraîné pour la formation de rétroaction)
Synthétiseur de base 2
Synthétiseur TTS avec contrainte de rétroaction
Wavernn Vocoder

Références et ressources

Rayhane-Mamah / Tacotron-2
Corentinj / voice en temps réel
Le chargeur de données à la volée et l'agrégation au niveau de l'énonciation pour la reconnaissance du locuteur et de la langue
Synthèse TTS naturelle en conditionnant les prédictions du wavenet sur le spectrogramme MEL
Synthèse audio neuronale efficace

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-08-24
taille 70.08MB
Provenant de Github

Applications connexes

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Moteur d'analyse de données Lihua version gratuite 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout