Bryan Agents เป็นระบบหลายตัวแทนขั้นสูงที่ออกแบบมาสำหรับการสร้างมิวสิควิดีโอตามเนื้อเพลง โครงการนี้วิเคราะห์เนื้อเพลงและสร้างพรอมต์โดยละเอียดตามผลการวิเคราะห์เพื่อสร้างภาพเหมือนเรื่องราวในที่สุดก็ผลิตมิวสิควิดีโอภาพเป็นภาพ ระบบใช้ประโยชน์จาก OpenAI API โดยเฉพาะรุ่น GPT-4O สำหรับการประมวลผลข้อความและโมเดล Dall-E 3 สำหรับการสร้างภาพเพื่อให้โซลูชันแบบ end-to-end สำหรับการสร้างเนื้อหาวิดีโอ
ก่อนที่คุณจะเริ่มตรวจสอบให้แน่ใจว่าคุณได้ปฏิบัติตามข้อกำหนดต่อไปนี้:
ffmpeg ติดตั้งและพร้อมใช้งานในเส้นทางของระบบของคุณffmpeg ffmpeg จากเว็บไซต์ทางการbin ลงในเส้นทางของระบบของคุณ:Path ในส่วน "ตัวแปรระบบ" และเลือก คลิกที่ "แก้ไข"bin ของไฟล์เก็บถาวร ffmpeg ที่แยกออกมา คลิก "ตกลง" เพื่อใช้การเปลี่ยนแปลง ติดตั้ง Homebrew หากคุณไม่ได้ติดตั้ง เปิดเทอร์มินัลแล้วเรียกใช้:
/bin/bash -c " $( curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh ) " ใช้ Homebrew เพื่อติดตั้ง ffmpeg :
brew install ffmpegสำหรับการแจกแจงแบบอิงตาม Debian (เช่น Ubuntu) ให้เปิดเทอร์มินัลและเรียกใช้:
sudo apt update
sudo apt install ffmpegสำหรับการแจกแจงแบบใช้หมวกสีแดง (เช่น Fedora) เปิดเทอร์มินัลและเรียกใช้:
sudo dnf install ffmpegโคลนที่เก็บ:
git clone https://github.com/tanbryan/ai-mv-generator
cd bryan-agentสร้างและเปิดใช้งานสภาพแวดล้อมเสมือนจริง (เป็นทางเลือก):
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`ติดตั้งการพึ่งพาที่ต้องการ:
pip install -r requirements.txtตั้งค่าคีย์ OpenAI API ของคุณ:
สร้างไฟล์ .env ในรูทโครงการและเพิ่มคีย์ OpenAI API ของคุณ:
OPENAI_API_KEY = " your_openai_api_key_here " เรียกใช้สคริปต์หลัก:
ตรวจสอบให้แน่ใจว่าไฟล์เนื้อเพลง (.lrc) และไฟล์เพลง (.mp3) อยู่ในไดเรกทอรีเฉพาะ ❗โปรดตรวจสอบให้แน่ใจว่าทั้งสองไฟล์มีชื่ออยู่ในรูปแบบของ 'songname-artistname.lrc หรือ. mp3' ไปที่สคริปต์ runner.py และเพิ่มเส้นทางที่สมบูรณ์ของคุณไปยังไฟล์ทั้งสอง: จากนั้นเรียกใช้:
python runner.pyการดำเนินการตัวแทนและการบันทึกผลลัพธ์:
แต่ละเอเจนต์จะทำงานตามลำดับในไฟล์เนื้อเพลงที่ให้ไว้:
ในระหว่างการดำเนินการไฟล์ agent_status.json จะถูกสร้างขึ้นในไดเรกทอรี base_agent ไฟล์นี้ติดตามสถานะของแต่ละเอเจนต์ หากเอเจนต์ใด ๆ เสร็จสิ้นสถานะของมันจะถูกตั้งค่าเป็น true คุณสามารถตั้งค่าสถานะเป็น false เพื่อเรียกใช้เอเจนต์เฉพาะอีกครั้งหากจำเป็น
ตรวจสอบพรอมต์ที่สร้างขึ้น:
สคริปต์จะหยุดชั่วคราวหลังจากสร้างพรอมต์ ตรวจสอบพวกเขาในไฟล์ JSON ที่สร้างขึ้นภายในไดเรกทอรีเนื้อเพลง เมื่อตรวจสอบแล้วกด Enter เพื่อดำเนินการต่อ
สร้างภาพและวิดีโอให้เสร็จสมบูรณ์:
ทำตามพรอมต์เพื่อให้กระบวนการสร้างภาพและวิดีโอเสร็จสมบูรณ์
ในไดเรกทอรี test หลังจากทำงานแล้วคุณจะพบเอาต์พุตตัวอย่างตาม "เรื่องราวความรัก" โดยไฟล์เนื้อเพลง Taylor Swift:
LoveStory-TaylorSwift.mp4 : ตัวอย่างของวิดีโอที่สร้างขึ้นสุดท้ายbackground.mp4 : ทำความสะอาดวิดีโอพื้นหลังที่สร้างขึ้นล่วงหน้าgenerated_prompts.json : ไฟล์ JSON ที่มีพรอมต์โดยละเอียดที่สร้างขึ้นสำหรับภาพlogo.png : โลโก้ที่สร้างขึ้นสำหรับมิวสิควิดีโอresults.json : ไฟล์ JSON ที่มีผลลัพธ์จากแต่ละเอเจนต์background_images/ : โฟลเดอร์ที่มีภาพพื้นหลังที่สร้างขึ้นตามพรอมต์ตัวอย่างเหล่านี้เป็นตัวอย่างของผลลัพธ์ที่คุณคาดหวังจากระบบ
โครงการนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT ดูไฟล์ใบอนุญาตสำหรับรายละเอียด