Bryan Agents adalah sistem multi-agen canggih yang dirancang untuk menghasilkan video musik berdasarkan lirik. Proyek ini menganalisis lirik dan menciptakan dorongan terperinci berdasarkan hasil analisis untuk menghasilkan gambar seperti cerita, pada akhirnya menghasilkan video musik gambar-ke-gambar. Sistem ini memanfaatkan API OpenAI, khususnya model GPT-4O untuk pemrosesan teks dan model Dall-E 3 untuk pembuatan gambar, untuk memberikan solusi ujung ke ujung untuk pembuatan konten video.
Sebelum Anda mulai, pastikan Anda telah memenuhi persyaratan berikut:
ffmpeg terpasang dan tersedia di jalur sistem Andaffmpeg ffmpeg dari situs web resmi.bin ke jalur sistem Anda:Path di bagian "Variabel Sistem" dan pilih. Klik "Edit".bin dari arsip ffmpeg yang diekstraksi. Klik "OK" untuk menerapkan perubahan. Instal Homebrew jika Anda tidak menginstalnya. Buka terminal dan jalankan:
/bin/bash -c " $( curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh ) " Gunakan Homebrew untuk menginstal ffmpeg :
brew install ffmpegUntuk distribusi yang berbasis di Debian (misalnya, Ubuntu), buka terminal dan jalankan:
sudo apt update
sudo apt install ffmpegUntuk distribusi berbasis Red Hat (misalnya, Fedora), buka terminal dan jalankan:
sudo dnf install ffmpegKlon Repositori:
git clone https://github.com/tanbryan/ai-mv-generator
cd bryan-agentBuat dan aktifkan lingkungan virtual (opsional):
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`Instal dependensi yang diperlukan:
pip install -r requirements.txtSiapkan Kunci API OpenAI Anda:
Buat file .env di root proyek dan tambahkan tombol API OpenAI Anda:
OPENAI_API_KEY = " your_openai_api_key_here " Jalankan skrip utama:
Pastikan file lirik (.lrc) dan file musik (.mp3) terletak di dalam direktori khusus. ❗️PLEASE Pastikan kedua file dinamai dalam format 'Songname-ArtistName.lrc atau .mp3' masuk ke skrip utama runner.py dan tambahkan jalur lengkap Anda ke kedua file: lalu jalankan:
python runner.pyEksekusi agen dan penghematan hasil:
Setiap agen akan bekerja secara berurutan pada file lirik yang disediakan:
Selama eksekusi, file agent_status.json akan dibuat di direktori base_agent. File ini melacak status masing -masing agen. Jika ada agen yang diselesaikan, statusnya akan diatur ke true . Anda selalu dapat mengatur status ke false untuk menjalankan kembali agen tertentu jika diperlukan.
Tinjau permintaan yang dihasilkan:
Script akan berhenti setelah menghasilkan petunjuk. Tinjau mereka di file JSON yang dihasilkan dalam direktori lirik. Setelah ditinjau, tekan Enter untuk melanjutkan.
Lengkapi gambar dan pembuatan video:
Ikuti petunjuk untuk menyelesaikan proses pembuatan gambar dan video.
Di direktori test , setelah berjalan, Anda akan menemukan output sampel berdasarkan "kisah cinta" oleh file lirik Taylor Swift:
LoveStory-TaylorSwift.mp4 : Pratinjau video final yang dihasilkan.background.mp4 : Video latar belakang yang dihasilkan pra yang bersih.generated_prompts.json : File JSON yang berisi prompt detail yang dihasilkan untuk gambar.logo.png : Logo yang dihasilkan untuk video musik.results.json : File JSON yang berisi hasil dari masing -masing agen.background_images/ : Sebuah folder yang berisi gambar latar belakang yang dihasilkan berdasarkan prompt.Sampel -sampel ini memberikan contoh output yang dapat Anda harapkan dari sistem.
Proyek ini dilisensikan di bawah lisensi MIT. Lihat file lisensi untuk detailnya.