
مع هذا المشروع ، يمكنك استخدام AI لإنشاء مسارات الموسيقى ومقاطع الفيديو. قدم بعض المعلومات حول كيفية رغبتك في الموسيقى ومقاطع الفيديو ، وسوف يقوم الرمز بالباقي.
أولاً ، نستخدم نموذجًا توليديًا لإنشاء عينات موسيقية ، فإن النموذج الافتراضي المستخدم هنا قادر فقط على إنشاء بحد أقصى 30 ثانية من الموسيقى ، لهذا السبب ، نأخذ خطوة أخرى لتوسيع الموسيقى. بعد الانتهاء من الجزء الصوتي ، يمكننا إنشاء الفيديو ، أولاً ، نبدأ بنموذج نشر مستقر لإنشاء صور ثم نستخدم نموذجًا توليديًا آخر لإعطائه القليل من الحركة والرسوم المتحركة. لتكوين مقطع الفيديو النهائي ، نأخذ كل موسيقى تم إنشاؤها والانضمام إلى العديد من الصور المتحركة حسب الضرورة لمطابقة طول الموسيقى.
ستقوم كل هذه الخطوات بإنشاء ملفات وسيطة يمكنك فحصها وإزالة ما لا تحب تحسين النتائج يدويًا.
النهج الموصى به لاستخدام هذا المستودع هو مع Docker ، ولكن يمكنك أيضًا استخدام VenV مخصص ، فقط تأكد من تثبيت جميع التبعيات.
ملاحظة: تأكد من تحديث الجهاز Param لزيادة الأداء إلى الحد الأقصى ، ولكن لاحظ أن بعض النماذج قد لا تعمل مع جميع خيارات الأجهزة (وحدة المعالجة المركزية ، CUDA ، MPS).
project_dir: beats
project_name: lofi
seed: 42
music:
prompt: "lo-fi music with a relaxing slow melody"
model_id: facebook/musicgen-small
device: cpu
n_music: 5
music_duration: 60
initial_music_tokens: 1050
max_continuation_duration: 20
prompt_music_duration: 10
image:
prompt: "Mystical Landscape"
prompt_modifiers:
- "concept art, HQ, 4k"
- "epic scene, cinematic, sci fi cinematic look, intense dramatic scene"
- "digital art, hyperrealistic, fantasy, dark art"
- "digital art, hyperrealistic, sense of comsmic wonder"
- "mystical and ethereal atmosphere, photo taken with a wide-angle lens"
model_id: stabilityai/sdxl-turbo
device: mps
n_images: 5
inference_steps: 3
height: 576
width: 1024
video:
model_id: stabilityai/stable-video-diffusion-img2vid
device: cpu
n_continuations: 2
loop_video: true
video_fps: 6
decode_chunk_size: 8
motion_bucket_id: 127
noise_aug_strength: 0.1
audio_clip:
n_music_loops: 1
بناء صورة Docker
make buildتطبيق الوبر والتنسيق على الرمز (اللازم فقط للتنمية)
make lintقم بتشغيل خط الأنابيب بأكمله لإنشاء الفيديو الموسيقي
make ai_beatsقم بتشغيل خطوة توليد الموسيقى
make musicقم بتشغيل خطوة استمرار الموسيقى
make music_continuationقم بتشغيل خطوة توليد الصور
make imageقم بتشغيل خطوة توليد الفيديو
make videoقم بتشغيل خطوة إنشاء مقطع الصوت
make audio_clip للتطور ، تأكد من تثبيت requirements-dev.txt وتشغيل make lint للحفاظ على نمط الترميز.
لقد قمت بتطوير واختبرت معظم هذا المشروع على جهاز MacBook Pro M2 الخاص بي ، والخطوة الوحيدة التي لم أتمكن من تشغيلها هي خطوة إنشاء الفيديو ، لذلك استخدمت Google Colab (مع V100 أو A100 GPU). لم يتم تشغيل بعض النماذج على MPS ولكنها تعمل في وقت معقول على أي حال.
تحتوي النماذج المستخدمة بشكل افتراضي هنا على تراخيص محددة قد لا تكون مناسبة لجميع حالات الاستخدام ، إذا كنت ترغب في استخدام نفس النماذج ، فتأكد من التحقق من تراخيصها. بالنسبة إلى Music Generation MusicGen وترخيص CC-BY-NC 4.0 ، لتوليد الصور SDXL-TURBO وترخيص الترخيص sdxl1.0 ، وانتشار الفيديو المستقر ورخصة ترخيص المجتمع المستقر للفيديو NC لتوليد الفيديو.