CTTS
1.0.0
基於統計參數語音綜合使用Merlin工具包,廣東話/中文文本到語音
該項目受MTT的影響
Python:Python3.6
系統:Linux(在Ubuntu16.04上測試)
sudo apt-get install libatlas3-base
運行bash tools/install_mtts.sh
或獨自下載文件
運行演示
bash run_demo.sh
python src/mtts.py txtfile wav_directory_path output_directory_path (Absolute path or relative path) Then you will get HTS label, if you have your own acoustic model trained by monthreal-forced-aligner, add -a your_acoustic_model.zip , otherwise, this project use thchs30.zip acoustic model as defaulttxtfile示例
A_01 这是一段文本
A_02 这是第二段文本
wav_directory示例(樣本率應大於16kHz)
A_01.wav
A_02.wav
python src/mandarin_frontend.py txtfile output_directory_path from mandarin_frontend import txt2label
result = txt2label('向香港特别行政区同胞澳门和台湾同胞海外侨胞')
[print(line) for line in result]
請參閱源代碼以獲取更多信息,但請注意對齊文件(SFS文件),格式是endtime phone_type而不是start_time, phone_type (這與Speece Ocean的數據不同)
該項目使用蒙特利爾(Montreal-Forced-Aligner)進行強制對齊,如果您想獲得更好的對齊方式,請使用數據來訓練對齊模型,請參見MFA:Algin-ingin-Isly-ofly-ly-the-the-dataset
您可以在沒有韻律標記的情況下生成HTS標籤。我們假設單詞段小於韻律單詞(在代碼中進行了調整)