ai mv generator Download - ai mv generator Quellcode Download

ai mv generator

AI-Quellcode

1.0.0

Herunterladen

AI-MV-Generator

Bryan Agents ist ein fortschrittliches Multi-Agent-System, das zum Generieren von Musikvideos basierend auf Texten entwickelt wurde. Dieses Projekt analysiert die Texte und erstellt detaillierte Eingabeaufforderungen basierend auf den Analyseergebnissen, um storyähnliche Bilder zu generieren und letztendlich ein Musik-zu-Image-Musikvideo zu erstellen. Das System nutzt die OpenAI-API, insbesondere das GPT-4O-Modell für die Textverarbeitung und das Dall-E 3-Modell für die Bildgenerierung, um eine End-to-End-Lösung für die Erstellung von Videoinhalten bereitzustellen.

Merkmale

Lyric Analyze Agent : Analysiert Texte und gruppiert sie für die weitere Verarbeitung.
Style Agent : Analysiert und wendet Stile auf den Inhalt an.
Eingabeaufforderung Agent : Erzeugt detaillierte Eingabeaufforderungen zum Erstellen von Musikvideo-Hintergrundbildern mit dem GPT-4O-Modell.
Bildagent : Erstellt Bilder basierend auf den generierten Eingabeaufforderungen mit dem Dall-E 3-Modell.
Logo Agent : Generiert Logos mit verschiedenen Effekten.
Video Agent : Kompiliert die generierten Bilder, Logos und Scorling -Texte in ein endgültiges Video.

Voraussetzungen

Stellen Sie vor Beginn sicher, dass Sie die folgenden Anforderungen erfüllt haben:

Python 3,8 oder höher
ffmpeg installiert und erhältlich auf dem Weg Ihres Systems
Erforderliche Python -Pakete installiert

Installieren von `ffmpeg`

Fenster:

Laden Sie ffmpeg von der offiziellen Website herunter.
Extrahieren Sie das heruntergeladene Archiv in einen Ordner Ihrer Wahl.
Fügen Sie den Ordner bin dem Pfad Ihres Systems hinzu:
- Öffnen Sie die Startsuche, geben Sie "env" ein und wählen Sie "Die Systemumgebungsvariablen bearbeiten".
- Klicken Sie im Fenster Systemeigenschaften auf die Schaltfläche "Umgebungsvariablen".
- Ermitteln Sie im Fenster Umgebungsvariablen die Path im Abschnitt "Systemvariablen" und wählen Sie sie aus. Klicken Sie auf "Bearbeiten".
- Klicken Sie auf "Neu" und fügen Sie den Pfad zum bin -Ordner des extrahierten ffmpeg -Archivs hinzu. Klicken Sie auf "OK", um die Änderungen anzuwenden.

macos:

Installieren Sie Homebrew , wenn Sie nicht installiert sind. Öffnen Sie das Terminal und laufen Sie:

/bin/bash -c " $( curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh ) "

Verwenden Sie Homebrew , um ffmpeg zu installieren:
```
brew install ffmpeg
```

Linux:

Für Debian-basierte Verteilungen (z. B. Ubuntu) öffnen Sie das Terminal und Run:
```
sudo apt update
sudo apt install ffmpeg
```
Für Red Hat-basierte Verteilungen (z. B. Fedora) öffnen Sie das Terminal und rennen:
```
sudo dnf install ffmpeg
```

Installation

Klonen Sie das Repository:

git clone https://github.com/tanbryan/ai-mv-generator
cd bryan-agent

Erstellen und aktivieren Sie eine virtuelle Umgebung (optional):

python -m venv venv
source venv/bin/activate  # On Windows use `venvScriptsactivate`

Installieren Sie die erforderlichen Abhängigkeiten:
```
pip install -r requirements.txt
```
Richten Sie Ihren OpenAI -API -Schlüssel ein:
Erstellen Sie eine .env -Datei im Projektroot und fügen Sie Ihren OpenAI -API -Schlüssel hinzu:
```
 OPENAI_API_KEY = " your_openai_api_key_here " 
```

Verwendung

Führen Sie das Hauptskript aus:
Stellen Sie sicher, dass sich die Lyrics -Datei (.LRC) und die Musikdatei (.mp3) in einem dedizierten Verzeichnis befinden. ❗️Plase Stellen Sie sicher, dass beide Dateien im Format von 'SongName-ArtistName.lrc oder .mp3' in den runner.py eingehen.
```
python runner.py
```
Ausführung und Ergebnissersparnis von Agenten:
Jeder Agent arbeitet nacheinander in der bereitgestellten Textedatei:
- LyricanalyzeAgent : Analysiert die Texte und gruppiert sie für die weitere Verarbeitung. Die Ergebnisse werden in einer JSON -Datei im Texteverzeichnis gespeichert.
- StyleAgent : Analysiert und wendet Stile auf den Inhalt an. Die Einstellungen im Basisstil werden in derselben JSON -Datei gespeichert.
- Eingabeaufforderung : Erzeugt detaillierte Eingabeaufforderungen zum Erstellen von Musikvideo -Hintergrundbildern. Das Skript wird innehalten, nachdem Sie die Eingabeaufforderungen generiert haben, sie in der generierten JSON -Datei zu überprüfen. Nach der Überprüfung drücken Sie die Eingabetaste, um fortzufahren.
- ImageAgent : Erstellt Bilder basierend auf den generierten Eingabeaufforderungen und speichert sie im angegebenen Verzeichnis.
- Logoagent : Erzeugt Logos mit verschiedenen Effekten.
- Videoagent : Kompiliert den Hintergrund und scrollen Sie Texte in ein letztes Video.
Während der Ausführung wird eine agent_status.json -Datei im Verzeichnis Base_agent erstellt. Diese Datei verfolgt den Status jedes Agenten. Wenn ein Agent abgeschlossen ist, wird der Status auf true festgelegt. Sie können den Status jederzeit auf false festlegen, um bei Bedarf einen bestimmten Agenten erneut auszusetzen.
Überprüfen Sie die generierten Eingabeaufforderungen:
Das Skript wird nach dem Erstellen der Eingabeaufforderungen innehalten. Überprüfen Sie sie in der generierten JSON -Datei im Verzeichnis von Texten. Nach der Überprüfung drücken Sie die Eingabetaste, um fortzufahren.
Vervollständigen Sie die Bild- und Videogenerierung:
Befolgen Sie die Eingabeaufforderungen, um den Bild- und Videogenerierungsprozess abzuschließen.

Testverzeichnis

Im test finden Sie nach dem Laufen Beispielausgaben basierend auf der "Liebesgeschichte" von Taylor Swift Lyrics Datei:

LoveStory-TaylorSwift.mp4 : Die Vorschau des endgültigen generierten Videos.

Lovestory-taylorswift.mp4

background.mp4 : Pre -generierter Hintergrund Video.
generated_prompts.json : Die JSON -Datei, die die für die Bilder generierten detaillierten Eingabeaufforderungen enthält.
logo.png : Das generierte Logo für das Musikvideo.
results.json : Die JSON -Datei, die die Ergebnisse jedes Agenten enthält.
background_images/ : Ein Ordner, der die basierenden Hintergrundbilder enthält, die basierend auf den Eingabeaufforderungen generiert sind.

Diese Proben bieten ein Beispiel für die Ausgabe, die Sie vom System erwarten können.