vits japros webui
1.0.0
bert-vits2參考文章:https://zenn.dev/litagin/articles/b1ddc1da5ea2b3
這是一個用於窗口的WebUI,可讓您學習日本VITS模型,並允許您用口音合成語音。如果您只有語音綜合,即使沒有圖形卡也可以使用它。
?語音綜合演示
| 語音綜合 | 學習 |
|---|---|
![]() | ![]() |
pyopenjtalk_prosody ,其中添加了強調符號。在這種情況下,我正在使用pyopenjtalk_prosody訓練G2P的模型,並為方便起見(Bing-Chan的建議)。
pyopenjtalk_prosody還處理諸如重音之類的符號,因此您可以使用它們來控制口音(ハ➚シハ➘シ)。
| 象徵 | 角色 | 例子 |
|---|---|---|
[ | 重音從這裡升起(圖像➚) | 您好→コ[ンニチワ |
] | 口音從這裡掉下來(圖像➘) | 京都→キョ]オト |
(半寬空間) | 剪切詩(以某種方式一塊蛋糕) | ソ[レワ ム[ズカシ]イ |
、 | 姿勢(屏住呼吸)。當您想做一個短姿勢時,請使用它。 | ハ]イ、ソ[オ オ[モイマ]ス |
? | 我將其添加到問題的結尾。 | キ[ミワ ダ]レ? |
這使您可以在本地Windows環境中訓練,負載和語音綜合JAPROS模型。
config.yaml中,它也應該有效我已經確認它在Windows 11上使用Python 3.10在RTX 4070上有效。
git clone https://github.com/litagin02/vits-japros-webui.gitsetup.bat 。 Setup complete.看起來,你完成了。webui_train.batpth文件,然後雙擊webui_infer.batupdate.bat有關更多信息,如果您不需要WebUI,請單擊此處。
對於模型,在weights目錄中創建一個子目錄,然後將{数字}epoch.pth文件放入其中。如果您使用的是外部模型(僅與pyopenjtalk_prosody在vits中與ESPNET兼容的模型),請在研究時還包括config.yaml 。
weights
├── model1
│ └── 100epoch.pth
|── model2
│ ├── 50epoch.pth
│ └── config.yaml
...
os.uname和符號鏈接創建位置進行修改)。