shanghainese tts 다운로드 - shanghainese tts 소스 코드 다운로드

shanghainese tts

AI 소스 코드

2023.06.06

다운로드

상하이어 TTS

Dartmouth Ling 48 최종 프로젝트 : Shanghainese의 TTS 개선
Yuanhao Chen [email protected] 2023 년 봄

목표

Shanghainese를위한 TTS (Text-To-Steeech) 시스템을 처음부터 구축하려면 텍스트 전처리에 특별한주의를 기울여 기존 모델과 비교하여 Tone Sandhi의 생산을 개선하려고합니다.

설명

쓰기/main.pdf를 참조하십시오.

의존성

pip install -r phonemisation/requirements.txt
pip install -r speech_synthesis/requirements.txt
pip install -r comparison_questionnaire/requirements.txt  # for analysis of questionnaire results

용법

speech_synthesis/README.md 참조하십시오.

구조

phonemisation/ : 음소화 모듈이 포함되어 있습니다
- phonemisation/__init__.py 의 출력에 대한 설명을 참조하십시오
- 사용법 : python -m phonemisation "text to phonemise"
- 메커니즘 : 중국 문장 - 단어 세분화 ⟶ 중국어 단어 - 로마인 화 ⟶ Shanghainese Pinyin - 음소화 ⟶ Shanghainese Phonemes
  - jieba 단어 세분화에 사용됩니다
  - 내가 이전에 만든 상하이 사전은 로마네이션에 사용되었습니다.
    - Qieyun 모듈을 사용하여 톤 윤포 / 인 빈 톤의 음절에 톤 번호 1 추가합니다. 다른 색조는 음성으로 표시되지 않습니다
  - romanisation.py 의 romanisation_to_ipa 기능에는 음성화 기능이 포함되어 있습니다
make_metadata.py : phonemisation 모듈을 사용하여 전사를 IPA로 변환하고 훈련을위한 메타 데이터를 생성합니다.
- data/
data/ : 교육에 사용되는 데이터 세트가 포함되어 있습니다
- 전사 및 오디오 파일은이 repo에서 조정되었습니다.
  - 훈련을 위해 16kHz로 다운 샘플링되었습니다
  - 현재 shh.dict.cn/ 만 훈련에 사용됩니다
- */metadata.txt 파일은 make_metadata.py 에 의해 생성됩니다
training/
- 모델 훈련을위한 Juptyer 노트
- Google Colab Environment에서 업로드 및 실행되도록 의도되었습니다. 로컬 사용을 위해 수정해야합니다
- VITS 구현이 포함 된 coqui-ai/TTS Repo를 사용합니다.
writeup/ : 쓰기
speech_synthesis/ : Speech Synthesis 모델이 포함되어 있습니다
- 자세한 내용은 speech_synthesis/README.md 참조하십시오
comparison_questionnaire/ :이 모델, Apple 모델 및 인간 스피커에서 생성 된 음성을 비교하는 데 사용되는 설문지 및 오디오 파일이 포함되어 있습니다.
- *-1.wav :이 모델에서 제작
- *-2.wav : Apple VoiceOver (MacBook Pro 14 인치, 2021; MacOS Ventura 13.0.1)
- *-3.wav : 혼자서 말한다
- stats.ipynb : 설문지 결과 분석을위한 Jupyter 노트