Descargar FCL taco2 - Descargar el código fuente FCL taco2

FCL taco2

Código Fuente de IA

1.0.0

Descargar

FCL-Taco2: Hacia la síntesis rápida, controlable y liviana de texto a voz (ICASSP 2021) Paper | Manifestación

Diagrama de bloques de Fcl-Taco2, donde el decodificador genera espectrogramas MEL en modo AR dentro de cada fonema y se comparte para todos los fonemas.

Ambiente

Python 3.6.10
antorcha 1.3.1
Chainer 6.0.0
ESPNET 8.0.0
ápice 0.1
Numpy 1.19.1
Kaldiio 2.15.1
Librosa 0.8.0

Entrenamiento e inferencia:

Paso 1. Preparación de datos y preprocesamiento

Descargar ljspeech
Descargar descargado ljspeech-1.1.tar.bz2 a /xx/ljspeech-1.1
Obtenga la información de alineación forzada utilizando la herramienta de alineador forzado de Montreal. O puede descargar nuestros resultados de alineación, luego desempaquetelo a /xx /textgrid
Preprocese el conjunto de datos para extraer espectrogramas MEL, duración del fonema, tono, energía y secuencia de fonemas por:
```
 python preprocessing.py --data-root /xx/LJSpeech-1.1 --textgrid-root /xx/TextGrid
```

Paso 2. Entrenamiento modelo

Modelo de maestro de capacitación FCL-Taco2-T:
```
 ./teacher_model_training.sh
```
Capacitación de estudiantes modelo FCL-Taco2-S:
```
 ./student_model_training.sh
```
Entrenamiento de Vocoder de Wavegan Parallel: siga las instrucciones aquí. También puede descargar el Vocoder PWG previamente capacitado y colocar el modelo PWG en el directorio "Vocoder".

Paso 3. Evaluación del modelo

Evaluación FCL-Taco2-T:
```
 ./inference_teacher.sh
```
Evaluación FCL-Taco2-S:
```
 ./inference_student.sh
```

Citación

Si el código se usa en su investigación, establezca nuestro repositorio y cita nuestro documento:

 @inproceedings{wang2021fcl,
  title={Fcl-Taco2: Towards Fast, Controllable and Lightweight Text-to-Speech Synthesis},
  author={Wang, Disong and Deng, Liqun and Zhang, Yang and Zheng, Nianzu and Yeung, Yu Ting and Chen, Xiao and Liu, Xunying and Meng, Helen},
  booktitle={ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)},
  pages={5714--5718},
  year={2021},
  organization={IEEE}
}

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-08-23
tamaño 228.8KB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo