Implementación de TTS con combinación de Tacotron2 y Hifi-Gan para mandarina TTS.
Para la inferencia, necesitamos descargar el modelo Tacotraon2 previamente capacitado para mandarín y colocar en la ruta de la raíz. Luego, podemos ejecutar infer_tacotron2_hifigan.py para obtener el resultado TTS. Podemos alterar el texto de entrada editando text variable en el infer_tacotron2_hifigan.py . Entonces el resultado se guardará en la ruta raíz llamada como output.wav .
El modelo previamente entrenado de Hifi-Gan se ha colocado en el LJ_FT_T2_V3 , que está entrenado por LJSPPECH y ajustado con Tacotron2. Puede encontrar más modelo previamente capacitado del repositorio original de Hifi-Gan con diferentes tamaños y parámetros. Si desea probar diferentes modelos o capacitar a su propio modelo, recuerde alterar variables en infer_tacotron2_hifigan.py para cambiar la ruta del modelo Hifi-Gan.
Entrada:相对论直接和间接的催生了量子力学的诞生也为研究微观世界的高速运动确立了全新的数学模型
Salida: tacotron2-hifigan.wav