مقالة مرجعية Bert-Vits2:
هذا هو webui لنظام التشغيل Windows يتيح لك تعلم نماذج Vits اليابانية ويسمح لك بتجميع الكلام مع لهجات. إذا كان لديك تخليق خطاب فقط ، فيمكنك استخدامه حتى بدون بطاقة رسومات.
؟ توليف الكلام العرض التوضيحي
| تخليق الكلام | يذاكر |
|---|---|
![]() | ![]() |
pyopenjtalk_prosody ، الذي يحتوي على رمز لهجة. في هذه الحالة ، أتناول نموذجًا مدربًا مع G2P باللغة اليابانية باستخدام pyopenjtalk_prosody وقراءته للراحة (اقتراح من Bing-chan).
يعالج Pyopenjtalk_prosody أيضًا رموزًا مثل اللهجات ، بحيث يمكنك استخدامها للتحكم في اللهجات (ハ➚シハ➘シ).
| رمز | دور | مثال |
|---|---|---|
[ | اللكنة ترتفع من هنا (صورة ➚) | مرحبًا →コ[ンニチワ |
] | اللكنة تسقط من هنا (صورة ➘) | كيوتو →キョ]オト |
(مساحة نصف عرض) | قصيدة المقطوعة في لهجة (بطريقة ما قطعة واحدة من الكعكة) | ソ[レワ ム[ズカシ]イ |
、 | تشكل (أخذ نفسا). استخدمه عندما تريد أن تجعل وضع قصير. | ハ]イ、ソ[オ オ[モイマ]ス |
? | سأضيفه إلى نهاية السؤال. | キ[ミワ ダ]レ? |
هذا شيء يتيح لك تدريب وتحميل وتوليف الكلام لنماذج Japros في بيئة Windows المحلية.
config.yaml لقد أكدت أنها تعمل على RTX 4070 على Windows 11 مع Python 3.10.
git clone https://github.com/litagin02/vits-japros-webui.gitsetup.bat في الداخل وانتظر لحظة. عند Setup complete. يظهر ، لقد انتهيت.webui_train.batpth ثم انقر نقرًا مزدوجًا فوق webui_infer.batupdate.batلمزيد من المعلومات وإذا لم تكن بحاجة إلى webui ، يرجى النقر هنا.
للنماذج ، قم بإنشاء دليل فرعي في دليل weights ووضع ملف {数字}epoch.pth في الداخل. إذا كنت تستخدم نموذجًا خارجيًا (متوافقًا فقط مع النماذج التي تم إنشاؤها باستخدام pyopenjtalk_prosody في حركات مع ESPNET) ، فيرجى أيضًا تضمين config.yaml عند الدراسة.
weights
├── model1
│ └── 100epoch.pth
|── model2
│ ├── 50epoch.pth
│ └── config.yaml
...
os.uname والرمزية).