tf_multispeakerTTS_fc Download - tf_multispeakerTTS

tf_multispeakerTTS_fc

Código-Fonte de IA

1.0.0

Baixar

Síntese de fala multispoaker com restrição de feedback do alto -falante Verificaiton

Esta é uma implementação do TensorFlow da rede TTS multispicoy introduzida em papel, desde a verificação do alto -falante até a síntese de fala multispicot, a transferência profunda com a restrição de feedback. Esse repositório também contém um modelo de verificação de alto-falante profundo que é usado no modelo TTS de vários falantes como rede de feedback. Amostras sintetizadas são fornecidas online.

Citação

 @inproceedings{Cai2020,
  author={Zexin Cai and Chuxiong Zhang and Ming Li},
  title={{From Speaker Verification to Multispeaker Speech Synthesis, Deep Transfer with Feedback Constraint}},
  year=2020,
  booktitle={Proc. Interspeech 2020}
}

Arquitetura de modelo

Onde a rede de incorporação de alto-falante é uma rede baseada em resnet:

Treinamento

Modelo de verificação do alto -falante

O modelo de verificação do alto -falante está localizado no diretório Deep_Speaker. Por configuração padrão, o modelo de verificação do alto -falante é treinado com dados voxceleb 1 e voxceleb 2. Você pode encontrar a lista de arquivos no diretório. Os hyperparameters são definidos em Vox12_Hparams.py.

Para treinar o modelo do alto -falante Verificiton do zero, prepare os dados listados na lista de arquivos e execute:

CUDA_VISIBLE_DEVICES=0 python train.py

Synthesizer TTS (sem controle de feedback)

Por configuração padrão, o sintetizador é treinado usando o conjunto de dados VCTK.

Extrair recurso de áudio usando process_audio.ipynb
Extrair incorporações de alto -falante usando o notebook ipython Deep_speaker/get_gvector.ipynb

Treine um sistema TTS multispicoker de linha de base

CUDA_VISIBLE_DEVICES=0 python synthesizer_train.py vctk datasets/vctk/synthesizer

Sinta -se à vontade para avaliar e sintetizar amostras usando syn.ipynb durante o treinamento

Vocoder neural (wavernn)

Por configuração padrão, o vocoder também é treinado usando o DataSet VCTK. Seria fácil depois de extrair o recurso acústico da seção anterior ( sintetizador TTS ). Para melhor desempenho, use o GTA MEL-Spectrograma obtido pelo vocoder_preprocess.py após o término do treinamento do sintetizador.

CUDA_VISIBLE_DEVICES=0 python vocoder_train.py -g --syn_dir datasets/vctk/synthesizer vctk datasets/vctk

Sintetizador TTS com restrição de feedback

Defina o caminho para o modelo de dois pré -terem previsto (o modelo de verificação do alto -falante e o sintetizador multispicoker) alterando as teclas correspondentes em hparams.py.
Treine o modelo e avalie a qualquer momento com feedback_syn.ipynb
```
CUDA_VISIBLE_DEVICES=0 python fc_synthesizer_train.py
```

Modelos pré-tenhados

Rede de incorporação de alto -falante
Synthesizer da linha de base 1 (usado como modelo pré -treinamento para o treinamento de feedback)
Síntese de linha de base 2
Sintetizador TTS com restrição de feedback
Vocoder wavernn

Referências e recursos

Rayhane-Mamah/ Tacotron-2
CORENTINJ/ CLONA DE VOIÇÃO em tempo real
O carregador de dados na fly-fly e a agregação em nível de enunciado para o reconhecimento de alto-falante e linguagem
Síntese natural de TTS por condicionamento de wavenet em previsões de espectrograma MEL
Síntese de áudio neural eficiente

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-08-24
tamanho 70.08MB
Vindo de Github

Aplicativos Relacionados

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Mecanismo de análise de dados Lihua versão gratuita 3.0_search_navigation_collection_public parecer_ranking_api

2022-06-28

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos