Bryan Agents-это продвинутая многоагентная система, предназначенная для создания музыкальных клипов, основанных на текстах. В этом проекте анализируется текст и создает подробные подсказки, основанные на результатах анализа, чтобы создать истории, похожие на истории, в конечном итоге создавая музыкальное видео с изображением к изображению. Система использует API OpenAI, в частности, модель GPT-4O для обработки текста и модель Dall-E 3 для генерации изображений, для предоставления сквозного решения для создания видеоконтента.
Прежде чем начать, убедитесь, что вы выполнили следующие требования:
ffmpeg установлен и доступен на пути вашей системыffmpeg ffmpeg с официального сайта.bin на путь вашей системы:Path в разделе «Системные переменные» и выберите ее. Нажмите «Редактировать».bin извлеченного архива ffmpeg . Нажмите «ОК», чтобы применить изменения. Установите Homebrew , если у вас его нет. Откройте терминал и запустите:
/bin/bash -c " $( curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh ) " Используйте Homebrew для установки ffmpeg :
brew install ffmpegДля распределений на базе Debian (например, Ubuntu) откройте терминал и запустите:
sudo apt update
sudo apt install ffmpegДля распределений на основе красной шляпы (например, Fedora) откройте терминал и запустите:
sudo dnf install ffmpegКлонировать репозиторий:
git clone https://github.com/tanbryan/ai-mv-generator
cd bryan-agentСоздайте и активируйте виртуальную среду (необязательно):
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`Установите требуемые зависимости:
pip install -r requirements.txtНастройте свой ключ API OpenAI:
Создайте файл .env в корне проекта и добавьте свой ключ API OpenAI:
OPENAI_API_KEY = " your_openai_api_key_here " Запустите основной сценарий:
Убедитесь, что файл текста (.lrc) и музыкальный файл (.mp3) расположены в специальном каталоге. ❗ Пожалуйста, убедитесь, что оба файла названы в формате 'songname-artistname.lrc или .mp3' Зайдите в основной скрипт runner.py и добавьте свои полные пути к обоим файлам: затем запустите:
python runner.pyВыполнение агента и сохранение результатов:
Каждый агент будет работать последовательно в предоставленном файле текстов:
Во время выполнения файл agent_status.json будет создан в каталоге BASE_AGENT. Этот файл отслеживает статус каждого агента. Если какой -либо агент завершится, его статус будет установлен на true . Вы всегда можете установить статус для false , чтобы повторно затронуть конкретного агента, если это необходимо.
Просмотрите сгенерированные подсказки:
Сценарий будет паузой после создания подсказок. Просмотрите их в сгенерированном файле JSON в каталоге текста. После просмотра нажмите Enter, чтобы продолжить.
Завершите генерацию изображения и видео:
Следуйте за подсказками, чтобы завершить процесс генерации изображения и видео.
В справочнике test , после запуска вы найдете образцы выходов на основе «истории любви» от текста Тейлор Свифт:
LoveStory-TaylorSwift.mp4 : Предварительный просмотр окончательного сгенерированного видео.background.mp4 : чистое предварительно сгенерированное фоновое видео.generated_prompts.json : файл JSON, содержащий подробные подсказки, сгенерированные для изображений.logo.png : сгенерированный логотип для музыкального видео.results.json : файл JSON, содержащий результаты каждого агента.background_images/ : папка, содержащая фоновые изображения, сгенерированные на основе подсказок.Эти образцы дают пример вывода, который вы можете ожидать от системы.
Этот проект лицензирован по лицензии MIT. Смотрите файл лицензии для получения подробной информации.