Bryan Adents是一种高级多代理系统,旨在根据歌词生成音乐视频。该项目分析歌词并根据分析结果创建详细的提示,以生成类似故事的图像,最终制作图像到图像的音乐视频。该系统利用OpenAI API,特别是用于文本处理的GPT-4O模型和图像生成的DALL-E 3模型,为创建视频内容创建提供了端到端的解决方案。
在开始之前,请确保您满足以下要求:
ffmpeg并在系统路径中可用ffmpeg ffmpeg 。bin文件夹添加到系统的路径:Path变量并选择它。单击“编辑”。ffmpeg存档的bin文件夹中。单击“确定”以应用更改。 如果您没有安装Homebrew ,则安装。打开终端并运行:
/bin/bash -c " $( curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh ) "使用Homebrew安装ffmpeg :
brew install ffmpeg对于基于Debian的发行版(例如Ubuntu),打开终端并运行:
sudo apt update
sudo apt install ffmpeg对于基于红帽的发行版(例如Fedora),打开终端并运行:
sudo dnf install ffmpeg克隆存储库:
git clone https://github.com/tanbryan/ai-mv-generator
cd bryan-agent创建并激活虚拟环境(可选):
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`安装所需的依赖项:
pip install -r requirements.txt设置您的OpenAI API密钥:
在项目root中创建.env文件,并添加您的OpenAI API密钥:
OPENAI_API_KEY = " your_openai_api_key_here " 运行主脚本:
确保歌词文件(.lrc)和音乐文件(.mp3)位于专用目录内。 ❗️please确保两个文件均以'songname-artistName.lrc或.mp3'的格式命名,请访问主脚本runner.py并将完整的路径添加到两个文件:然后运行:
python runner.py代理执行和结果保存:
每个代理商将在提供的歌词文件上依次工作:
在执行过程中,将在base_agent目录中创建一个agent_status.json文件。该文件跟踪每个代理的状态。如果任何代理人完成,其状态将设置为true 。如果需要,您始终可以将状态设置为false以重新运行特定代理。
查看生成的提示:
生成提示后,脚本将暂停。在歌词目录中的生成的JSON文件中查看它们。审核后,按Enter继续进行。
完成图像和视频生成:
请按照提示完成图像和视频生成过程。
在test目录中,运行后,您将根据Taylor Swift歌词文件找到基于“爱情故事”的示例输出:
LoveStory-TaylorSwift.mp4 :最终生成视频的预览。background.mp4 :清洁预生成的背景视频。generated_prompts.json :JSON文件,其中包含为图像生成的详细提示。logo.png :音乐视频的生成徽标。results.json :JSON:包含每个代理的结果的JSON文件。background_images/ :一个基于提示生成的背景图像的文件夹。这些样本提供了您可以从系统中期望的输出的示例。
该项目已根据MIT许可获得许可。有关详细信息,请参见许可证文件。