Descarga de slide to video - Descarga de código fuente de slide to video

slide to video

Código Fuente de IA

1.0.0

Descargar

diapositiva

Una herramienta que convierte un mazo de diapositivas en un video, completo con tu narración de voz. Admite múltiples idiomas.

Instalación

Probado en Ubuntu 20.04.

Instalar ffmpeg :
```
sudo apt-get install ffmpeg
```
Instale Python (> = 3.9 y <= 3.11) y pip si aún no lo ha hecho.

Clon e instale esta herramienta :

git clone [email protected]:Changochen/slide-to-video.git
cd slide-to-video
pip install .

Verificar la instalación :
```
slide-to-video
```

Preparación

Deck Slide : Crea un mazo de diapositivas en formato PDF.
Script : prepare un archivo de script en formato de texto plano, con diapositivas separadas por el marker NEWSLIDE .
Archivo o modelo de audio : grabe un archivo de audio de su voz en formato MP3 para la clonación de voz. Si utiliza servicios pagos como Play.ht, debe tener un modelo de voz disponible.

Uso

slide-to-video --model MODEL_NAME --slide slide --script script --output-dir OUTPUT_PATH --config ADDITIONAL_CONFIG.yaml

Uso de ejemplo

Para usar un modelo de voz local:

slide-to-video --model local --slide example/slide.pdf --script example/script.txt --voice example/sample.mp3 --output-dir output

Se generará un video final en el directorio OUTPUT_PATH como output.mp4 .

salida.mp4

Para obtener más opciones, incluido el ajuste de la velocidad del habla, ejecute:

slide-to-video --help

Modelo compatible actualmente :

TTS
Play.ht

Idiomas compatibles actualmente : 'en', 'es', 'fr', 'de', 'it', 'pt', 'pl', 'tr', 'ru', 'nl', 'cs', 'ar', 'zh-cn', 'hu', 'ko', 'ja', 'hi' '

Regeneración en caché

Después de generar el video, el directorio de salida contendrá un archivo project.yaml , que ayuda a omitir la generación de contenido sin cambios. Si las entradas siguen siendo las mismas, la herramienta omite el proceso de generación de videos.

Para forzar la regeneración

Si modifica la diapositiva, script o configuración (como la velocidad del habla), la herramienta regenera el contenido afectado. Para forzar la regeneración de partes específicas, establezca el campo force_reset del elemento correspondiente en project.yaml en el directorio de salida.

Apoya un nuevo modelo de voz

Para admitir un nuevo modelo de voz, debe implementar una nueva clase en src/slide_to_video/tts_engine y registrar la clase llamando register_engine (ver un ejemplo aquí).

Notas

En la primera carrera, puede ver el siguiente mensaje:

 > You must confirm the following:
| > "I have purchased a commercial license from Coqui: [email protected]"
| > "Otherwise, I agree to the terms of the non-commercial CPML: https://coqui.ai/cpml" - [y/n]
| | >

Simplemente ingrese y .

Expandir

Información adicional