CTTS
1.0.0
基于统计参数语音综合使用Merlin工具包,广东话/中文文本到语音
该项目受MTT的影响
Python:Python3.6
系统:Linux(在Ubuntu16.04上测试)
sudo apt-get install libatlas3-base
运行bash tools/install_mtts.sh
或独自下载文件
运行演示
bash run_demo.sh
python src/mtts.py txtfile wav_directory_path output_directory_path (Absolute path or relative path) Then you will get HTS label, if you have your own acoustic model trained by monthreal-forced-aligner, add -a your_acoustic_model.zip , otherwise, this project use thchs30.zip acoustic model as defaulttxtfile示例
A_01 这是一段文本
A_02 这是第二段文本
wav_directory示例(样本率应大于16kHz)
A_01.wav
A_02.wav
python src/mandarin_frontend.py txtfile output_directory_path from mandarin_frontend import txt2label
result = txt2label('向香港特别行政区同胞澳门和台湾同胞海外侨胞')
[print(line) for line in result]
请参阅源代码以获取更多信息,但请注意对齐文件(SFS文件),格式是endtime phone_type而不是start_time, phone_type (这与Speece Ocean的数据不同)
该项目使用蒙特利尔(Montreal-Forced-Aligner)进行强制对齐,如果您想获得更好的对齐方式,请使用数据来训练对齐模型,请参见MFA:Algin-ingin-Isly-ofly-ly-the-the-dataset
您可以在没有韵律标记的情况下生成HTS标签。我们假设单词段小于韵律单词(在代码中进行了调整)