vits japros webui
1.0.0
Bert-vits2 참조 기사 : https://zenn.dev/litagin/articles/b1ddc1da5ea2b3
이것은 일본어 vits 모델을 배우고 악센트로 음성을 종합 할 수있는 Windows 용 Webui입니다. 음성 합성 만있는 경우 그래픽 카드 없이도 사용할 수 있습니다.
? 음성 합성 데모
| 음성 합성 | 공부하다 |
|---|---|
![]() | ![]() |
pyopenjtalk_prosody 입니다. 이 상황에서는 pyopenjtalk_prosody 사용하여 일본어로 G2P로 교육을받은 모델을 가져 와서 편의를 위해 읽 습니다 (Bing-chan의 제안).
pyopenjtalk_prosody는 악센트와 같은 기호를 처리하므로 악센트를 제어하는 데 사용할 수 있습니다 (ハ➚シハ➘シ).
| 상징 | 역할 | 예 |
|---|---|---|
[ | 악센트는 여기에서 상승합니다 (➚의 이미지) | 안녕하세요 →コ[ンニチワ |
] | 악센트는 여기에서 떨어집니다 (➘의 이미지) | 교토 →キョ]オト |
(반 폭 공간) | 악센트시의 컷 (어떻게 든 한 조각의 케이크) | ソ[レワ ム[ズカシ]イ |
、 | 포즈 (숨을 쉬고). 짧은 포즈를 만들고 싶을 때 사용하십시오. | ハ]イ、ソ[オ オ[モイマ]ス |
? | 질문의 끝에 추가하겠습니다. | キ[ミワ ダ]レ? |
이것은 로컬 Windows 환경에서 VITS Japros 모델의 훈련,로드 및 음성 합성을 할 수있는 것입니다.
config.yaml 에 포함되면 작동해야합니다. Python 3.10과 함께 Windows 11의 RTX 4070에서 작동한다고 확인했습니다.
git clone https://github.com/litagin02/vits-japros-webui.gitsetup.bat 클릭하고 잠시 기다리십시오. Setup complete. 나타납니다, 당신은 끝났습니다.webui_train.bat 두 번 클릭하십시오pth 파일을 배치 한 다음 webui_infer.bat 두 번 클릭하려면 아래를 볼 수 있습니다.update.bat자세한 내용과 WebUI가 필요하지 않은 경우 여기를 클릭하십시오.
모델의 경우 weights 디렉토리에 하위 디렉토리를 작성하고 {数字}epoch.pth 파일을 내부에 배치하십시오. 외부 모델을 사용하는 경우 (ESPNET과 함께 Vits의 Pyopenjtalk_prosody로 만든 모델과 호환되는 경우) 공부할 때 config.yaml 도 포함하십시오.
weights
├── model1
│ └── 100epoch.pth
|── model2
│ ├── 50epoch.pth
│ └── config.yaml
...
os.uname 및 기호 링크 생성 위치에만 수정됩니다).