نص توليد الصوت القائم على الاسترجاع إلى نظام الكلام هو نص يعتمد على Python إلى الكلام يعتمد على جزأين أساسيين. لتكون قادرًا على إنشاء الكلام ، يعتمد على Tacotron لتحويل النص إلى الكلام ، ثم يستخدم تحويل صوت RVC ليكون قادرًا على جعله يبدو وكأنه حرف دون الحاجة إلى استخدام ملف صوتي.
تم اختبار هذا TTS على Python 3.10 على الرغم من أنه قد يعمل على إصدارات أخرى.
يجب عليك الحصول على أحدث إصدار 64 بت Espeak ng.
من أجل إنشاء اعتماد فيرسيك ، يتعين عليك الحصول على Visual Studio وتثبيت حزمة تطوير "سطح المكتب مع C ++".
لاستخدامه ، قم بتثبيت الشعر وتثبيت المتطلبات poetry install --no-root ثم قم بتنزيل نموذج Hubert ، ونموذج Tacotron للأمام وأي نموذج RVC. يمكنك بعد ذلك وضعها في مجلد النموذج مع الأسماء المقابلة:
hubert_base.pt -> hubert.ptforward_steps90k.pt -> forward.pt(rvc .pth model name) -> rvc_model.pth(rvc .index model name) -> rvc_index.index (اختياري) بمجرد حصولك على كل هذه الأشياء ، يمكنك تشغيل ملف RVG.py مع الوسائط المطلوبة على CLI ، قم بتشغيل الملف دون أي وسيطات لإطلاق Gradio Webui أو يمكنك تضمين هذا الرمز في مشروعك الخاص واستيراد وظيفة rvg_tts من RVG.py
من أجل استخدام لغة مختلفة ، يجب تدريب نموذج Tacotron جديد للأمام. هذا شيء لا يمكنني القيام به بدون مجموعة بيانات. هذا هو المكان الذي أطلب فيه المساعدة من المجتمع. إذا كنت تستطيع تقديم مجموعة بيانات ، يرجى القيام بذلك.
تم ترخيص Tacotron إلى الأمام بموجب ترخيص معهد ماساتشوستس للتكنولوجيا
RVC Webui مرخصة بموجب ترخيص MIT
حقوق الطبع والنشر 2023 Foxify52
مرخصة بموجب ترخيص Apache ، الإصدار 2.0 ("الترخيص") ؛ لا يجوز لك استخدام هذا الملف إلا في الامتثال للترخيص. يمكنك الحصول على نسخة من الترخيص على
http://www.apache.org/licenses/LICENSE-2.0
ما لم يكن مطلوبًا بموجب القانون المعمول به أو الموافقة على الكتابة ، يتم توزيع البرامج الموزعة بموجب الترخيص على أساس "كما هي" ، دون ضمانات أو شروط من أي نوع ، إما صريحة أو ضمنية. راجع ترخيص الأذونات والقيود التي تحكم اللغة المحددة بموجب الترخيص.