هذا امتداد بسيط للعيوب من النصوص النصية التي تتيح TTS متعددة اللغات ، مع استنساخ الصوت باستخدام XTTSV2 من Coqui-AI/TTS.
تم دمج XTTSV2 الآن في الولادة النصية Webui (Coqui_TTS). لا يزال بإمكاني تحديث هذا الامتداد لميزة الراوي ، ولكن إذا كنت لا تهتم بذلك ، فاستخدم الامتداد الرسمي.
هذا امتداد خام للغاية رميته معًا بسرعة بناءً على امتداد Barktts. قد يعمل أو لا يعمل. لا تتردد في تحسين الكود وتقديم العلاقات العامة.
قم بتنشيط بيئتك عن طريق تشغيل cmd_windows.bat / cmd_linux.sh / cmd_macos.sh / cmd_wsl.bat اعتمادًا على النظام الأساسي الخاص بك ، أو قم بتنشيط بيئة conda إذا قمت بتثبيتها يدويًا. استنساخ هذا الريبو:
cd extensions
git clone https://github.com/kanttouchthis/text_generation_webui_xtts
تثبيت التبعيات ل TTS.
cd text_generation_webui_xtts
pip install -r requirements.txt
تثبيت TTS. تتسبب متطلبات الإصدار في مشكلات ، لذلك نقوم بتثبيت التبعيات أعلاه ، دون متطلبات الإصدار.
pip install TTS --no-dependencies
بمجرد الانتهاء من الخطوات أعلاه ، يمكنك إضافة بعض الأصوات إلى مجلد Voices. يمكن أن يكون هذا أي مقطع قصير (3-6 ثوانٍ) WAV لشخص يتحدث. تأكد من أنه صوت عالي الجودة مع عدم وجود فجوات طويلة. بعد ذلك ، قم بتشغيل webui باستخدام --extensions text_generation_webui_xtts وحدد صوتك/لغتك والإعدادات الأخرى في الأسفل. قد تضطر إلى قبول الشروط والأحكام عبر وحدة التحكم عند تشغيلها لأول مرة.