تنزيل تنزيل end to end_deepfake_colab رمز end to end_deepfake

end to end_deepfake_colab

كود الذكاء الاصطناعي

1.0.0

تنزيل

توليد فيديو DeepFake من شامل إلى طرف

ملخص

يوفر دفتر Colab Notebook دليلًا خطوة بخطوة لإنشاء مقطع فيديو DeepFake عن طريق استنساخ صوت على مقطع فيديو. تتضمن العملية تحميل ملفات الفيديو والصوت ، وإعادة تسميتها ، واستخراج الصوت ، وإنشاء قطع صوتية ، وأخيراً باستخدام WAV2LIP لتوليد DeepFake.

خطوات

قبل تنفيذ هذا الكمبيوتر الدفتري ، نحتاج إلى وجود مجلد في محرك Google الخاص بنا المسمى deepfake مع ملف فيديو على الأقل (تنسيق MP4). يوصى بشدة بتضمين ملف الصوت (تنسيق MP3) لاستنساخ الصوت من. خاصة بالنسبة لحالات اللغة غير الإنجليزية في الفيديو ، من الضروري تحميل ملف صوتي باللغة الإنجليزية أيضًا.

تحذير: يجب فصل موجه النص بـ "|" من كل جمل إلى جملتين (كل 20 ثانية يستغرق قراءتها). إذا حصلت على أي تحذيرات وتم اقتراح جلسة إعادة التشغيل (بعد تثبيت مكتبة - مثل Librosa ، كما هو موضح في الشكل أدناه) ، انقر فوق "إلغاء". في الإصدار المجاني (T4 أو V100 مع 15 جيجابايت VRAM و ~ 13 جيجابايت من ذاكرة الوصول العشوائي) يمكن أن يكون الحد الأقصى لمدة الصوت/الفيديو ~ 50 ثانية (يستغرق حوالي 30 دقيقة لتشغيل البرنامج النصي والحصول على النتائج). للحصول على مطالبة نصية أطول ، هناك حاجة إلى وحدة معالجة الرسومات الأكبر (نسخة مدفوعة باستخدام L4 مع 22.5 جيجابايت VRAM و 63 جيجابايت من ذاكرة الوصول العشوائي أو A100 مع 40 جيجابايت VRAM و ~ 84 جيجابايت من ذاكرة الوصول العشوائي - يستخدم الأخير المزيد من وحدات/ساعة).

1. تحميل الملفات والملفات الصوتية

Mount Google Drive للوصول إلى الملفات.
تغيير الدليل إلى المسار المحدد.

 from google . colab import drive
drive . mount ( '/content/gdrive' )

cd gdrive / MyDrive / deepfake

2. تعيين مسار قاعدة

حدد المسار الأساسي لملفات الفيديو والصوت.

 base_path = '/content/gdrive/MyDrive/deepfake'

3. تثبيت التبعيات

تثبيت مكتبات TTS و Pydub و MoviePy.

!p ip install - q pydub == 0.25 . 1 TTS == 0.22 . 0 moviepy == 1.0 . 3

4. تعيين نص للقراءة

اضبط النص الإنجليزي الذي سيتم قراءته مع الصوت المستنسخ.

 text_to_read = "Joining two modalities results in a surprising increase in generalization! \ n What would happen if we combined them all? "

5. إعادة تسمية ملفات الصوت والفيديو

أعد تسمية ملفات الصوت والفيديو التي تم تحميلها إلى input_voice.mp3 و video_full.mp4 ، على التوالي.

6. استخراج الصوت من الفيديو (إذا لزم الأمر)

إذا تم توفير مقطع فيديو فقط ، استخرج الصوت منه لاستنساخ الفرد.

7. إنشاء قطع صوتية

قم بإنشاء مجلد مع أجزاء من الصوت 10 ثانية لاستخدامها كمدخلات في السلحفاة.

8. تأكيد مدة الصوت والفيديو

تأكد من أن الصوت والفيديو لديهم نفس المدة. إذا لم يكن الأمر كذلك ، قم بقص واحد أطول لتتناسب مع واحد أقصر (أو قطعها على حد سواء إلى 20 ثانية).

9. استنساخ مستودع WAV2LIP ونماذج التنزيل

Clone Wav2Lip Github Restository ، قم بتنزيل النماذج التي تم تدريبها مسبقًا ، وتثبيت التبعيات.

10. توليد DeepFake

قم بتشغيل البرنامج النصي للاستدلال WAV2LIP لإنشاء فيديو DeepFake.

11. التنظيف

إزالة الملفات والمجلدات المؤقتة.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-08-23
الحجم 57.09KB
من Github

تطبيقات ذات صلة

Newsletter_sign up_form

2024-11-01
نهاية أيون

2022-08-28
نهاية النجوم

2022-08-24
وظيفة طريق مسدود

2022-08-22
الحراس: النهاية قريبة

2022-08-10
النهاية المصيرية: ملفات القضية الحقيقية

2022-07-24

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل