Справочная статья Bert-Vits2: https://zenn.dev/litagin/articles/b1ddc1da5ea2b3
Это WebUI для Windows, которая позволяет вам изучать японские модели VITS и позволяет синтезировать речь с акцентами. Если у вас есть только синтез речи, вы можете использовать его даже без видеокарты.
? Речь Синтез Демо
| Синтез речи | изучать |
|---|---|
![]() | ![]() |
pyopenjtalk_prosody , который добавляет символ акцента. В этой ситуации я принимаю модель, обученную G2P на японском языке, используя pyopenjtalk_prosody и читая ее для удобства (предложение от Bing-Chan).
pyopenjtalk_prosody также обрабатывает такие символы, как акценты, поэтому вы можете использовать их для управления акцентами (ハ➚シハ➘シ).
| символ | роль | пример |
|---|---|---|
[ | Акцент поднимается отсюда (изображение ➚) | Привет →コ[ンニチワ |
] | Акцент падает отсюда (изображение ➘) | Киото →キョ]オト |
(Полвочка пространства) | Вырезать в акцентом стихотворение (каким -то образом один кусок торта) | ソ[レワ ム[ズカシ]イ |
、 | Поза (захватывает дыхание). Используйте его, когда хотите сделать короткую позу. | ハ]イ、ソ[オ オ[モイマ]ス |
? | Я добавлю его к концу вопроса. | キ[ミワ ダ]レ? |
Это то, что позволяет тренировать, нагружать и синтез речи моделей Vits Japros в локальной среде Windows.
config.yaml Я подтвердил, что он работает на RTX 4070 на Windows 11 с Python 3.10.
git clone https://github.com/litagin02/vits-japros-webui.gitsetup.bat внутри и подождите мгновение. При Setup complete. Появляется, все готово.webui_train.batpth файл, а затем дважды щелкните webui_infer.batupdate.batДля получения дополнительной информации, и если вам не нужна Webui, пожалуйста, нажмите здесь.
Для моделей создайте подкаталог в каталоге weights и поместите файл {数字}epoch.pth внутрь. Если вы используете внешнюю модель (только совместиму с моделями, созданными с pyopenjtalk_prosody в VIT с ESPNET), также включите config.yaml при изучении.
weights
├── model1
│ └── 100epoch.pth
|── model2
│ ├── 50epoch.pth
│ └── config.yaml
...
os.uname и Symbolic Locations создания ссылок).