Bryan Agents هو نظام متقدم متعدد الوكلاء مصمم لإنشاء مقاطع فيديو موسيقية على أساس كلمات. يقوم هذا المشروع بتحليل كلمات الأغاني وإنشاء مطالبات مفصلة بناءً على نتائج التحليل لإنشاء صور تشبه القصة ، مما يؤدي في النهاية إلى إنتاج فيديو موسيقي صورة إلى صورة. يستفيد النظام من Openai API ، وتحديداً نموذج GPT-4O لمعالجة النص ونموذج Dall-E 3 لتوليد الصور ، لتوفير حل شامل لإنشاء محتوى الفيديو.
قبل البدء ، تأكد من استوفت المتطلبات التالية:
ffmpeg مثبتة ومتاحة في مسار نظامكffmpeg ffmpeg من الموقع الرسمي.bin إلى مسار نظامك:Path في قسم "متغيرات النظام" وحدده. انقر على "تحرير".bin لأرشيف ffmpeg المستخرج. انقر فوق "موافق" لتطبيق التغييرات. قم بتثبيت Homebrew إذا لم يتم تثبيته. افتح الجهاز وتشغيله:
/bin/bash -c " $( curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh ) " استخدم Homebrew لتثبيت ffmpeg :
brew install ffmpegللتوزيعات المستندة إلى دبيان (على سبيل المثال ، Ubuntu) ، افتح المحطة وتشغيلها:
sudo apt update
sudo apt install ffmpegللتوزيعات القائمة على القبعة الحمراء (على سبيل المثال ، فيدورا) ، افتح المحطة وتشغيلها:
sudo dnf install ffmpegاستنساخ المستودع:
git clone https://github.com/tanbryan/ai-mv-generator
cd bryan-agentإنشاء وتفعيل بيئة افتراضية (اختياري):
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`تثبيت التبعيات المطلوبة:
pip install -r requirements.txtقم بإعداد مفتاح API Openai:
قم بإنشاء ملف .env في جذر المشروع وأضف مفتاح API Openai:
OPENAI_API_KEY = " your_openai_api_key_here " قم بتشغيل البرنامج النصي الرئيسي:
تأكد من وجود ملف كلمات (.lrc) وملف الموسيقى (.mp3) داخل دليل مخصص. please تأكد من تسمية كلا الملفين بتنسيق "songname-artistname.lrc أو .mp3 'انتقل إلى runner.py الرئيسي وأضف مساراتك الكاملة إلى كلا الملفين: ثم تشغيل:
python runner.pyتنفيذ الوكيل وحفظ النتائج:
سيعمل كل وكيل بشكل متتابع على ملف كلمات المقدمة:
أثناء التنفيذ ، سيتم إنشاء ملف agent_status.json في دليل base_agent. يتتبع هذا الملف حالة كل وكيل. في حالة الانتهاء من أي وكيل ، سيتم ضبط حالته على true . يمكنك دائمًا تعيين الحالة على false لإعادة تشغيل وكيل معين إذا لزم الأمر.
مراجعة المطالبات التي تم إنشاؤها:
سوف يتوقف البرنامج النصي بعد إنشاء المطالبات. راجعها في ملف JSON الذي تم إنشاؤه داخل دليل كلمات. بمجرد المراجعة ، اضغط على Enter للمتابعة.
أكمل توليد الصورة والفيديو:
اتبع المطالبات لإكمال عملية توليد الصور والفيديو.
في دليل test ، بعد الجري ، ستجد عينة مخرجات بناءً على "قصة الحب" التي كتبها ملفات Taylor Swift:
LoveStory-TaylorSwift.mp4 : معاينة الفيديو الذي تم إنشاؤه النهائي.background.mp4 : نظافة فيديو خلفية تم إنشاؤها مسبقًا.generated_prompts.json : ملف JSON يحتوي على المطالبات التفصيلية التي تم إنشاؤها للصور.logo.png : الشعار الذي تم إنشاؤه للفيديو الموسيقي.results.json : ملف JSON يحتوي على نتائج كل وكيل.background_images/ : مجلد يحتوي على صور الخلفية التي تم إنشاؤها بناءً على المطالبات.توفر هذه العينات مثالاً على الإخراج الذي يمكنك توقعه من النظام.
هذا المشروع مرخص بموجب ترخيص معهد ماساتشوستس للتكنولوجيا. انظر ملف الترخيص للحصول على التفاصيل.