A Bryan Agents é um sistema multi-agente avançado projetado para gerar vídeos musicais com base nas letras. Este projeto analisa as letras e cria instruções detalhadas com base nos resultados da análise para gerar imagens semelhantes a histórias, produzindo um videoclipe de imagem para imagem. O sistema aproveita a API OpenAI, especificamente o modelo GPT-4O para processamento de texto e o modelo Dall-E 3 para geração de imagens, para fornecer uma solução de ponta a ponta para criação de conteúdo de vídeo.
Antes de começar, verifique se você atendeu aos seguintes requisitos:
ffmpeg instalado e disponível no caminho do seu sistemaffmpeg ffmpeg no site oficial.bin ao caminho do seu sistema:Path na seção "Variáveis do sistema" e selecione -a. Clique em "Editar".bin do compartimento do arquivo ffmpeg extraído. Clique em "OK" para aplicar as alterações. Instale Homebrew se você não o tiver instalado. Abra o terminal e corra:
/bin/bash -c " $( curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh ) " Use Homebrew para instalar ffmpeg :
brew install ffmpegPara distribuições baseadas em Debian (por exemplo, Ubuntu), abra o terminal e execute:
sudo apt update
sudo apt install ffmpegPara distribuições baseadas em Red Hat (por exemplo, Fedora), abra o terminal e execute:
sudo dnf install ffmpegClone o repositório:
git clone https://github.com/tanbryan/ai-mv-generator
cd bryan-agentCrie e ativar um ambiente virtual (opcional):
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`Instale as dependências necessárias:
pip install -r requirements.txtConfigure sua chave de API do OpenAI:
Crie um arquivo .env na raiz do projeto e adicione sua chave de API do OpenAI:
OPENAI_API_KEY = " your_openai_api_key_here " Execute o script principal:
Certifique -se de que o arquivo de letras (.LRC) e o arquivo de música (.mp3) estejam localizados em um diretório dedicado. ❗️Porase Verifique se os dois arquivos são nomeados no formato de 'SongName-artistname.lrc ou .mp3', vá para o script principal runner.py e adicione seus caminhos completos aos dois arquivos: depois execute:
python runner.pyExecução do agente e economia de resultados:
Cada agente funcionará sequencialmente no arquivo de letras fornecidas:
Durante a execução, um arquivo agent_status.json será criado no diretório BASE_AGENT. Este arquivo acompanha o status de cada agente. Se algum agente concluir, seu status será definido como true . Você sempre pode definir o status como false para executar novamente um agente específico, se necessário.
Revise os avisos gerados:
O script fará uma pausa depois de gerar os prompts. Revise -os no arquivo JSON gerado no diretório da letra. Depois de revisado, pressione Enter para continuar.
Complete a geração de imagem e vídeo:
Siga os avisos para concluir o processo de geração de imagem e vídeo.
No diretório test , após a execução, você encontrará saídas de amostra com base na "História de Love" do arquivo de letras de Taylor Swift:
LoveStory-TaylorSwift.mp4 : A prévia do vídeo final gerado.background.mp4 : Vídeo de fundo pré -gerado limpo.generated_prompts.json : o arquivo json que contém os avisos detalhados gerados para as imagens.logo.png : o logotipo gerado para o videoclipe.results.json : O arquivo JSON que contém os resultados de cada agente.background_images/ : Uma pasta que contém as imagens de fundo geradas com base nos prompts.Essas amostras fornecem um exemplo da saída que você pode esperar do sistema.
Este projeto está licenciado sob a licença do MIT. Consulte o arquivo de licença para obter detalhes.