FCL taco2 Download - FCL taco2 Download de código fonte

FCL taco2

Código-Fonte de IA

1.0.0

Baixar

FCL-TACO2: em direção à síntese rápida, controlável e leve de texto em fala (ICASSP 2021) | Demonstração

Diagrama de blocos do FCL-Taco2, onde o decodificador gera espectrogramas MEL no modo AR dentro de cada fonema e é compartilhado para todos os fonemas.

Ambiente

Python 3.6.10
Tocha 1.3.1
Chainner 6.0.0
ESPNET 8.0.0
Apex 0.1
Numpy 1.19.1
Kaldiio 2.15.1
Librosa 0.8.0

Treinamento e inferência:

Etapa1. Preparação de dados e pré -processamento

Baixe LJSpeech
Desmarque baixado ljspeech-1.1.tar.bz2 para /xx/ljspeech-1.1
Obtenha as informações de alinhamento forçado usando a ferramenta Aligner forçada de Montreal. Ou você pode baixar nossos resultados de alinhamento e descompactá -los para /xx /textGrid
Pré-processo o conjunto de dados para extrair espectrogramas MEL, duração do fonema, afinação, energia e sequência de fonemas por:
```
 python preprocessing.py --data-root /xx/LJSpeech-1.1 --textgrid-root /xx/TextGrid
```

Etapa2. Treinamento modelo

Professor de treinamento Modelo FCL-Taco2-T:
```
 ./teacher_model_training.sh
```
Treinamento Modelo do aluno FCL-Taco2-S:
```
 ./student_model_training.sh
```
Treinamento do vocoder de onda paralela: Siga as instruções aqui. Você também pode baixar o vocoder PWG pré-treinado e colocar o modelo PWG no diretório "vocoder".

Etapa3. Avaliação do modelo

Avaliação Fcl-Taco2-T:
```
 ./inference_teacher.sh
```
Avaliação FCL-TACO2-S:
```
 ./inference_student.sh
```

Citação

Se o código for usado em sua pesquisa, estrela nosso repositório e cite nosso artigo:

 @inproceedings{wang2021fcl,
  title={Fcl-Taco2: Towards Fast, Controllable and Lightweight Text-to-Speech Synthesis},
  author={Wang, Disong and Deng, Liqun and Zhang, Yang and Zheng, Nianzu and Yeung, Yu Ting and Chen, Xiao and Liu, Xunying and Meng, Helen},
  booktitle={ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)},
  pages={5714--5718},
  year={2021},
  organization={IEEE}
}

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-08-23
tamanho 228.8KB
Vindo de Github

Aplicativos Relacionados

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos