Bert-Vits2 Article de référence: https://zenn.dev/litagin/articles/b1ddc1da5ea2b3
Il s'agit d'un webui pour Windows qui vous permet d'apprendre des modèles de vites japonais et vous permet de synthétiser la parole avec des accents. Si vous n'avez qu'une synthèse de la parole, vous pouvez l'utiliser même sans carte graphique.
? Démo de synthèse de la parole
| Synthèse de la parole | étude |
|---|---|
![]() | ![]() |
pyopenjtalk_prosody , qui a un symbole d'accent ajouté. Dans cette situation, je prends un modèle formé avec G2P en japonais en utilisant pyopenjtalk_prosody et le lisant pour plus de commodité (une proposition de Bing-chan).
pyopenjtalk_prosody gère également des symboles tels que des accents, vous pouvez donc les utiliser pour contrôler les accents (ハ➚シハ➘シ).
| symbole | rôle | exemple |
|---|---|---|
[ | L'accent monte d'ici (image de ➚) | Bonjour →コ[ンニチワ |
] | L'accent tombe d'ici (image de ➘) | Kyoto →キョ]オト |
(Espace demi-largeur) | La coupe en poème d'accent (en quelque sorte un seul morceau de gâteau) | ソ[レワ ム[ズカシ]イ |
、 | Poser (prendre une respiration). Utilisez-le lorsque vous souhaitez faire une courte pose. | ハ]イ、ソ[オ オ[モイマ]ス |
? | Je vais l'ajouter à la fin de la question. | キ[ミワ ダ]レ? |
C'est quelque chose qui vous permet de vous entraîner, de charger et de la synthèse de la parole de modèles Japros dans un environnement Windows local.
config.yaml J'ai confirmé que cela fonctionne sur RTX 4070 sur Windows 11 avec Python 3.10.
git clone https://github.com/litagin02/vits-japros-webui.gitsetup.bat à l'intérieur et attendez un instant. Une fois Setup complete. apparaît, vous avez terminé.webui_train.batpth , puis double-cliquez sur webui_infer.batupdate.batPour plus d'informations et si vous n'avez pas besoin d'un webui, veuillez cliquer ici.
Pour les modèles, créez un sous-répertoire dans le répertoire weights et placez le fichier {数字}epoch.pth à l'intérieur. Si vous utilisez un modèle externe (uniquement compatible avec les modèles créés avec pyopenjtalk_prosody dans VITS avec ESPNET), veuillez également inclure config.yaml lors de l'étude.
weights
├── model1
│ └── 100epoch.pth
|── model2
│ ├── 50epoch.pth
│ └── config.yaml
...
os.uname et les emplacements de création de liens symboliques).