Инструмент, который преобразует слайд -колоду в видео, в комплекте с вашим голосовым повествованием. Поддержите несколько языков.
Протестировано на Ubuntu 20.04.
ffmpeg : sudo apt-get install ffmpegpip , если вы еще этого не сделали.git clone [email protected]:Changochen/slide-to-video.git
cd slide-to-video
pip install .slide-to-videoNEWSLIDE .slide-to-video --model MODEL_NAME --slide slide --script script --output-dir OUTPUT_PATH --config ADDITIONAL_CONFIG.yamlДля использования локальной голосовой модели:
slide-to-video --model local --slide example/slide.pdf --script example/script.txt --voice example/sample.mp3 --output-dir output Последнее видео будет сгенерировано в каталоге OUTPUT_PATH как output.mp4 .
Для получения дополнительных вариантов, включая настройку скорости речи, запустите:
slide-to-video --helpВ настоящее время поддерживается модель :
В настоящее время поддерживаемые языки : 'en', 'es', 'fr', 'de', 'it', 'pt', 'pl', 'tr', 'ru', 'nl', 'cs', 'ar', 'zh-cn', 'hu', 'ko', 'ja', 'Hi'
После создания видео выходной каталог будет содержать файл project.yaml , который помогает пропустить генерацию неизменного контента. Если входы остаются прежними, инструмент пропускает процесс генерации видео.
Если вы измените слайд, скрипт или настройки (например, скорость речи), инструмент восстанавливает пораженный контент. Чтобы вызвать регенерацию определенных частей, установите поле force_reset соответствующего элемента в project.yaml в выходном каталоге.
Чтобы поддержать новую голосовую модель, вам необходимо внедрить новый класс в src/slide_to_video/tts_engine и зарегистрировать класс, позвонив по телефону register_engine (см. Пример здесь).
> You must confirm the following:
| > "I have purchased a commercial license from Coqui: [email protected]"
| > "Otherwise, I agree to the terms of the non-commercial CPML: https://coqui.ai/cpml" - [y/n]
| | >
y .