نظام تخليق الكلام متعدد اللغات باستخدام حالات
16GB .12GB من VRAM.أمر تثبيت Pytorch:
pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117 CUDA 11.7 تثبيت: https://developer.nvidia.com/cuda-11-7-0-download-archive
Zlib DLL تثبيت: https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#install-zlib-windows
تثبيت pyopenjtalk يدويًا: pip install -U pyopenjtalk --no-build-isolation
إذا لم يتم تثبيت هذا الأمر ، فيرجى تثبيت المكتبة التالية قبل المتابعة: cmake Cython
conda create -n polylangvits python=3.8conda activate polylangvitsgit clone https://github.com/ORI-Muchim/PolyLangVITS.git cd PolyLangVITSpip install -r requirements.txtضع ملفات الصوت على النحو التالي.
.MP3 أو .WAV Files على ما يرام.
يجب أن تكتب "[رمز اللغة]" على ظهر مجلد السماعة.
PolyLangVITS
├────datasets
│ ├───speaker0[KO]
│ │ ├────1.mp3
│ │ └────1.wav
│ └───speaker1[JA]
│ │ ├───1.mp3
│ │ └───1.wav
│ ├───speaker2[EN]
│ │ ├────1.mp3
│ │ └────1.wav
│ ├───speaker3[ZH]
│ │ ├────1.mp3
│ │ └────1.wav
│ ├integral.py
│ └integral_low.py
│
├────vits
├────get_pretrained_model.py
├────inference.py
├────main_low.py
├────main_resume.py
├────main.py
├────Readme.md
└────requirements.txt
هذا مجرد مثال ، ولا بأس في إضافة المزيد من مكبرات الصوت.
لبدء هذه الأداة ، استخدم الأمر التالي ، واستبدال {language} و {model_name} و {sample_rate} مع قيم كل منهما:
python main.py {language} {model_name} {sample_rate}بالنسبة لأولئك الذين لديهم مواصفات منخفضة (VRAM <12 جيجابايت) ، يرجى استخدام هذا الرمز:
python main_low.py {language} {model_name} {sample_rate}إذا اكتمل تكوين البيانات وتريد استئناف التدريب ، أدخل هذا الرمز:
python main_resume.py {model_name}بعد تدريب النموذج ، يمكنك إنشاء تنبؤات باستخدام الأمر التالي ، واستبدال {model_name} و {model_step} مع قيم كل منهما:
python inference.py {model_name} {model_step}للحصول على نص لاستنتاج الكلام ، استخدم ما يلي:
python inference-stt.py {model_name} {model_step}أيضًا ، يمكنك تمرير النص يدويًا دون تحرير الرمز بواسطة:
python inference-stt.py {model_name} {model_step} {text}لمزيد من المعلومات ، يرجى الرجوع إلى المستودعات التالية: