shanghainese tts
2023.06.06
Shanghainese를위한 TTS (Text-To-Steeech) 시스템을 처음부터 구축하려면 텍스트 전처리에 특별한주의를 기울여 기존 모델과 비교하여 Tone Sandhi의 생산을 개선하려고합니다.
쓰기/main.pdf를 참조하십시오.
pip install -r phonemisation/requirements.txt
pip install -r speech_synthesis/requirements.txt
pip install -r comparison_questionnaire/requirements.txt # for analysis of questionnaire results speech_synthesis/README.md 참조하십시오.
phonemisation/ : 음소화 모듈이 포함되어 있습니다phonemisation/__init__.py 의 출력에 대한 설명을 참조하십시오python -m phonemisation "text to phonemise"jieba 단어 세분화에 사용됩니다Qieyun 모듈을 사용하여 톤 윤포 / 인 빈 톤의 음절에 톤 번호 1 추가합니다. 다른 색조는 음성으로 표시되지 않습니다romanisation.py 의 romanisation_to_ipa 기능에는 음성화 기능이 포함되어 있습니다make_metadata.py : phonemisation 모듈을 사용하여 전사를 IPA로 변환하고 훈련을위한 메타 데이터를 생성합니다.data/data/ : 교육에 사용되는 데이터 세트가 포함되어 있습니다shh.dict.cn/ 만 훈련에 사용됩니다*/metadata.txt 파일은 make_metadata.py 에 의해 생성됩니다training/coqui-ai/TTS Repo를 사용합니다.writeup/ : 쓰기speech_synthesis/ : Speech Synthesis 모델이 포함되어 있습니다speech_synthesis/README.md 참조하십시오comparison_questionnaire/ :이 모델, Apple 모델 및 인간 스피커에서 생성 된 음성을 비교하는 데 사용되는 설문지 및 오디오 파일이 포함되어 있습니다.*-1.wav :이 모델에서 제작*-2.wav : Apple VoiceOver (MacBook Pro 14 인치, 2021; MacOS Ventura 13.0.1)*-3.wav : 혼자서 말한다stats.ipynb : 설문지 결과 분석을위한 Jupyter 노트