End to End TTS Fine Tune
1.0.0
Acoustic-fastspeech2(自定义)
合理的表现,利用转移学习来用少量数据进行个性化
提供可以实时在韩国数据集中进行微调创建的API
根据微调修改型号代码
简单的预处理,火车,通过Shell脚本合成
提供独特的Docker图像
它匹配FastSpeech2和HIFI-GAN预先训练的CKPT的文件名,并将其保留在每个型号中。
(fastspeech2:30,000步进学习 / hifi -gan -jungil king的官方假装-University -University)
对于学习和综合,我们加载和执行包含所有相关软件包的Docker图像。
docker pull hws0120/e2e_speech_synthesis
run_fs2_preprocessing.sh步骤通过conda命令连接到docker,并安装python package jamo。
conda activate aligner
pip install jamo
虚拟环境的结束,以执行RUN_FS2_TRAIN或合成。
conda activate base
如果您遇到上述所有项目,请运行Shell脚本以提取MFA。
sh run_FS2_preprocessing.sh
# Enter the dataset name
[Dataset_Name](ex. HW)
成功地创建了一个文本格言,以退出虚拟环境并运行学习脚本。
sh run_FS2_train.sh
# Enter the dataset name
[Dataset_Name](ex. HW)
FastSpeech2 5000步骤学习完成后,请运行HIFI-GAN脚本。
sh run_HiFi-GAN_train.sh
# Enter the dataset name
[Dataset_Name](ex. HW)
当准备就绪CKPT文件夹中学习的模型时,请运行脚本以进行合成。
sh run_FS2_synthesize.sh
# Enter the dataset name
[Dataset_Name](ex. HW)
每个容器均在学习和合成过程中建立,如图所示。
如果您有适当的HIFI-GAN检查站,则可以省略Hifi-GAN学习。