Téléchargement slide to video - Téléchargement du code source de slide to video

slide to video

Code Source AI

1.0.0

Télécharger

diapositive

Un outil qui convertit un pont de diapositives en vidéo, avec votre narration vocale. Prise en charge de plusieurs langues.

Installation

Testé sur Ubuntu 20.04.

Installer ffmpeg :
```
sudo apt-get install ffmpeg
```
Installez Python (> = 3,9 et <= 3.11) et pip si vous ne l'avez pas déjà fait.

Cloner et installer cet outil :

git clone [email protected]:Changochen/slide-to-video.git
cd slide-to-video
pip install .

Vérifiez l'installation :
```
slide-to-video
```

Préparation

Deck de diapositives : créez un pont de diapositives au format PDF.
Script : Préparez un fichier de script au format de texte brut, avec des diapositives séparées par le marqueur NEWSLIDE .
Fichier audio ou modèle : enregistrez un fichier audio de votre voix au format MP3 pour le clonage vocal. Si vous utilisez des services payants comme Play.ht, vous devriez avoir un modèle vocal disponible.

Usage

slide-to-video --model MODEL_NAME --slide slide --script script --output-dir OUTPUT_PATH --config ADDITIONAL_CONFIG.yaml

Exemple d'utilisation

Pour utiliser un modèle vocal local:

slide-to-video --model local --slide example/slide.pdf --script example/script.txt --voice example/sample.mp3 --output-dir output

Une vidéo finale sera générée dans le répertoire OUTPUT_PATH en tant que output.mp4 .

output.mp4

Pour plus d'options, notamment en ajustant la vitesse de la parole, exécutez:

slide-to-video --help

Modèle actuellement pris en charge :

Tts
play.ht

Langues actuellement prises en charge : 'en', 'es', 'fr', 'de', 'it', 'pt', 'pl', 'tr', 'ru', 'nl', 'cs', 'ar', 'zh-cn', 'hu', 'ko', 'ja', 'salut' '

Régénération mise en cache

Après avoir généré la vidéo, le répertoire de sortie contiendra un fichier project.yaml , qui aide à ignorer la génération de contenu inchangé. Si les entrées restent les mêmes, l'outil saute le processus de génération vidéo.

Forcer la régénération

Si vous modifiez la diapositive, le script ou les paramètres (comme la vitesse de la parole), l'outil régénère le contenu affecté. Pour forcer la régénération de pièces spécifiques, définissez le champ force_reset de l'élément correspondant dans project.yaml dans le répertoire de sortie.

Soutenir un nouveau modèle vocal

Pour prendre en charge un nouveau modèle vocal, vous devez implémenter une nouvelle classe dans src/slide_to_video/tts_engine et enregistrer la classe en appelant register_engine (voir un exemple ici).

Notes

Lors de la première course, vous pouvez voir l'invite suivante:

 > You must confirm the following:
| > "I have purchased a commercial license from Coqui: [email protected]"
| > "Otherwise, I agree to the terms of the non-commercial CPML: https://coqui.ai/cpml" - [y/n]
| | >

Entrez simplement y .

Développer

Informations supplémentaires