slide to video - slide to video Código Fonte Download

slide to video

Código-Fonte de IA

1.0.0

Baixar

slide-to-video

Uma ferramenta que converte um deck deslizante em um vídeo, completo com sua narração de voz. Suporte a vários idiomas.

Instalação

Testado no Ubuntu 20.04.

Instale ffmpeg :
```
sudo apt-get install ffmpeg
```
Instale o python (> = 3.9 e <= 3.11) e pip , se você ainda não o fez.

Clone e instale esta ferramenta :

git clone [email protected]:Changochen/slide-to-video.git
cd slide-to-video
pip install .

Verifique a instalação :
```
slide-to-video
```

Preparação

Slide Deck : Crie um deck deslizante no formato PDF.
Script : Prepare um arquivo de script em formato de texto simples, com lâminas separadas pelo NEWSLIDE do marcador.
Arquivo ou modelo de áudio : grave um arquivo de áudio da sua voz no formato MP3 para clonagem de voz. Se você usar serviços pagos como play.ht, deve ter um modelo de voz disponível.

Uso

slide-to-video --model MODEL_NAME --slide slide --script script --output-dir OUTPUT_PATH --config ADDITIONAL_CONFIG.yaml

Exemplo de uso

Para usar um modelo de voz local:

slide-to-video --model local --slide example/slide.pdf --script example/script.txt --voice example/sample.mp3 --output-dir output

Um vídeo final será gerado no diretório OUTPUT_PATH como output.mp4 .

output.mp4

Para mais opções, incluindo o ajuste da velocidade da fala, execute:

slide-to-video --help

Modelo atualmente suportado :

TTS
play.ht

Atualmente apoiado idiomas : 'en', 'es', 'fr', 'de', 'it', 'pt', 'pl', 'tr', 'ru', 'nl', 'cs', 'ar', 'zh-cn', 'hu', 'ko', 'ja', 'hi'

Regeneração em cache

Depois de gerar o vídeo, o diretório de saída conterá um project.yaml , que ajuda a pular a geração de conteúdo inalterado. Se as entradas permanecerem as mesmas, a ferramenta pula o processo de geração de vídeo.

Para forçar a regeneração

Se você modificar o slide, o script ou as configurações (como a velocidade da fala), a ferramenta regenera o conteúdo afetado. Para forçar a regeneração de peças específicas, defina o campo force_reset do item correspondente no project.yaml no diretório de saída.

Apoie um novo modelo de voz

Para suportar um novo modelo de voz, você precisa implementar uma nova classe em src/slide_to_video/tts_engine e registrar a classe chamando register_engine (consulte um exemplo aqui).

Notas

Na primeira execução, você pode ver o seguinte prompt:

 > You must confirm the following:
| > "I have purchased a commercial license from Coqui: [email protected]"
| > "Otherwise, I agree to the terms of the non-commercial CPML: https://coqui.ai/cpml" - [y/n]
| | >

Basta entrar em y .

Expandir

Informações adicionais