دبلجة تلقائية مع استنساخ الصوت والتعرف على الكلام
أصبح من الممكن بفضل OpenVoice ، Melotts ، Whisper أسرع ، Voicefixer ، Python-Audio-Separator و FFMPEG.

PRS موضع ترحيب ، وهذا في الغالب مجرد دليل على المفهوم. بعض الأفكار الجيدة للتحسين تشمل:
قم بتثبيت FFMPEG و FFProbe و Ffplay على نظامك وتأكد من أنها في طريقها. يمكنك تنزيلها من هنا.
قم بعمل دليل جديد واستنساخ هذا المستودع:
git clone https://github.com/igerman00/Pollyduble
cd Pollydubleconda create -n dubbing python=3.9conda activate dubbinggit clone https://github.com/myshell-ai/OpenVoiceتأكد من أن مستودع OpenVoice في نفس الدليل مثل هذا المستودع ، يجب تسميته "OpenVoice".
cd OpenVoice
pip install -e .
pip install git+https://github.com/myshell-ai/MeloTTS.git
python -m unidic downloadtorch بدعم GPU (يجب أن يكون معلمة INDEX-URL اختيارية لعدم دعم GPU): pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 cd .. # Go back to the root directory of the repo
pip install -r requirements-win-cu118.txtdemo.py الخاص بنا ، ويسمى video.mp4 .python demo.py -i video.mp4 -s -m سيتم تخزين الإخراج في دليل Pollyduble/output بشكل افتراضي. سيحتوي على العديد من الملفات بما في ذلك الفيديو المدبلج ، والصوت المنفصل ، والصوت المدبلج ، وعينة الصوت. في الغالب ، يجب أن يكون نقرة واحدة.
تشمل الخيارات:
-iأو--inputلتحديد ملف الفيديو الإدخال-oأو--outputلتحديد دليل الإخراج (الافتراضي هوPollyduble/output)-vأو--voiceحالة تحديد عينة مخصصة للاستنساخ الصوتي. إذا لم يتم تحديدها ، سيتم إنشاء واحد من أول 15 ثانية من الفيديو-sأو--separateلتمكين فصل الصوت ، أي استخراج موسيقى الخلفية والكلام من الفيديو بشكل منفصل-mأو--muxلتمكين Muxing الصوت المنفصل مرة أخرى إلى الفيديو مع الكلام المدبلج-fأو--fixلتمكين إصلاح الصوت ، أي تحسين جودة الكلام المدبلج.
^ تجريبي ولا يبدو في الواقع هذا جيد معظم الوقت.--helpلعرض رسالة المساعدة
تم ترخيص هذا المشروع بموجب ترخيص معهد ماساتشوستس للتكنولوجيا - راجع ملف الترخيص للحصول على التفاصيل.