shanghainese tts
2023.06.06
要从头开始为上海构建文本到语音(TTS)系统,以通过对文本的预处理特别注意与现有模型相比,试图改善Sandhi的产生。
请参阅写入/main.pdf。
pip install -r phonemisation/requirements.txt
pip install -r speech_synthesis/requirements.txt
pip install -r comparison_questionnaire/requirements.txt # for analysis of questionnaire results 请参阅speech_synthesis/README.md 。
phonemisation/ :包含音密模块phonemisation/__init__.pypython -m phonemisation "text to phonemise"jieba用于单词细分Qieyun模块将音调数字1添加到阴平yinping / inbin音调的音节中;其他音调在语音上没有标记romanisation_to_ipa函数在romanisation.py中包含音量功能make_metadata.py :使用phonemisation模块将转录转换为IPA并生成元数据进行训练data/data/ :包含用于培训的数据集shh.dict.cn/用于培训*/metadata.txt文件由make_metadata.py生成training/coqui-ai/TTS repo,其中包含VIT的实现writeup/ :写speech_synthesis/ :包含语音合成模型speech_synthesis/README.mdcomparison_questionnaire/ :包含用于比较该模型产生的语音,Apple模型和人类说话的调查表和音频文件*-1.wav :该模型生产*-2.wav :由Apple Voiceover生产(MacBook Pro 14英寸,2021; MacOS Ventura 13.0.1)*-3.wav :我自己说的stats.ipynb :用于分析问卷结果的jupyter笔记本