shanghainese tts
2023.06.06
要從頭開始為上海構建文本到語音(TTS)系統,以通過對文本的預處理特別注意與現有模型相比,試圖改善Sandhi的產生。
請參閱寫入/main.pdf。
pip install -r phonemisation/requirements.txt
pip install -r speech_synthesis/requirements.txt
pip install -r comparison_questionnaire/requirements.txt # for analysis of questionnaire results 請參閱speech_synthesis/README.md 。
phonemisation/ :包含音密模塊phonemisation/__init__.pypython -m phonemisation "text to phonemise"jieba用於單詞細分Qieyun模塊將音調數字1添加到陰平yinping / inbin音調的音節中;其他音調在語音上沒有標記romanisation_to_ipa函數在romanisation.py中包含音量功能make_metadata.py :使用phonemisation模塊將轉錄轉換為IPA並生成元數據進行訓練data/data/ :包含用於培訓的數據集shh.dict.cn/用於培訓*/metadata.txt文件由make_metadata.py生成training/coqui-ai/TTS repo,其中包含VIT的實現writeup/ :寫speech_synthesis/ :包含語音合成模型speech_synthesis/README.mdcomparison_questionnaire/ :包含用於比較該模型產生的語音,Apple模型和人類說話的調查表和音頻文件*-1.wav :該模型生產*-2.wav :由Apple Voiceover生產(MacBook Pro 14英寸,2021; MacOS Ventura 13.0.1)*-3.wav :我自己說的stats.ipynb :用於分析問卷結果的jupyter筆記本