slide to video -Download - slide to video -Quellcode -Download

slide to video

AI-Quellcode

1.0.0

Herunterladen

Slide-to-Video

Ein Werkzeug, das ein Foliendeck in ein Video umwandelt, das mit Ihrer Sprachzählung komplett ist. Unterstützen Sie mehrere Sprachen.

Installation

Getestet auf Ubuntu 20.04.

Installieren Sie ffmpeg :
```
sudo apt-get install ffmpeg
```
Installieren Sie Python (> = 3.9 und <= 3.11) und pip , wenn Sie es noch nicht getan haben.

Klonen und installieren Sie dieses Tool :

git clone [email protected]:Changochen/slide-to-video.git
cd slide-to-video
pip install .

Überprüfen Sie die Installation :
```
slide-to-video
```

Vorbereitung

Dia -Deck : Erstellen Sie ein Dia -Deck im PDF -Format.
Skript : Bereiten Sie eine Skriptdatei im Klartextformat vor, wobei die Folien durch den Marker NEWSLIDE getrennt sind.
Audiodatei oder Modell : Notieren Sie eine Audiodatei Ihrer Stimme im MP3 -Format für Sprachklonen. Wenn Sie kostenpflichtige Dienste wie Play.HT verwenden, sollten Sie ein Sprachmodell zur Verfügung haben.

Verwendung

slide-to-video --model MODEL_NAME --slide slide --script script --output-dir OUTPUT_PATH --config ADDITIONAL_CONFIG.yaml

Beispiel Verwendung

Um ein lokales Sprachmodell zu verwenden:

slide-to-video --model local --slide example/slide.pdf --script example/script.txt --voice example/sample.mp3 --output-dir output

Ein endgültiges Video wird im Verzeichnis OUTPUT_PATH als output.mp4 generiert.

output.mp4

Weitere Optionen, einschließlich der Anpassung der Sprachgeschwindigkeit, laufen Sie:

slide-to-video --help

Derzeit unterstütztes Modell :

TTS
Play.ht

Derzeit unterstützte Sprachen : 'en', 'es', 'fr', 'de', 'es', 'pt', 'pl', 'tr', 'ru', 'nl', 'cs', 'ar', 'zh-cn', 'Hu', 'KO', 'ja', 'hi'

Regeneration zwischengespeicherte

Nach dem Generieren des Videos enthält das Ausgabeverzeichnis eine project.yaml -Datei, mit der die Erzeugung unveränderter Inhalte übersprungen wird. Wenn Eingaben gleich bleiben, überspringt das Tool den Videogenerierungsvorgang.

Regeneration erzwingen

Wenn Sie die Folie, das Skript oder die Einstellungen (wie die Sprachgeschwindigkeit) ändern, wird das Tool den betroffenen Inhalt regeneriert. Um die Regeneration bestimmter Teile zu erzwingen, setzen Sie das Feld force_reset des entsprechenden Elements in project.yaml im Ausgabeverzeichnis.

Unterstützen Sie ein neues Sprachmodell

Um ein neues Sprachmodell zu unterstützen, müssen Sie eine neue Klasse in src/slide_to_video/tts_engine implementieren und die Klasse registrieren, indem Sie register_engine anrufen (siehe ein Beispiel hier).

Notizen

Beim ersten Lauf sehen Sie möglicherweise die folgende Eingabeaufforderung:

 > You must confirm the following:
| > "I have purchased a commercial license from Coqui: [email protected]"
| > "Otherwise, I agree to the terms of the non-commercial CPML: https://coqui.ai/cpml" - [y/n]
| | >

Einfach y eingeben.

Expandieren

Zusätzliche Informationen