ai_trailer Скачать - загрузка исходного кода ai

ai_trailer

Другой исходный код

1.0.0

Скачать

Автоматическое генерация трейлеров с использованием искусственного интеллекта

Я написал пару сообщений в блоге, связанном с этим проектом, обязательно их проверьте

Создание трейлеров фильмов с ИИ описывает проект более подробно
Использование Gemini 1.5 Pro для создания трейлеров видео исследует использование возможностей Gemini 1.5 Pro в этом же проекте

Я также адаптировал этот проект для конкуренции «Google - Gemini Long».

Суммировало прохождение видео
Полное прохождение видео
Записная книжка Kaggle
Google Colab Notebook

Идея этого репозитория состоит в том, чтобы автоматически генерировать ряд кандидатов в трейлер для данного видео, пользователю необходимо только предоставить видеофайл и пару параметров текста, и все остальное позаботится.

Как это работает?

Во -первых, мы при желании принимаем сюжет видео в IMDB и разделяем его на сюжеты, вместо того, чтобы брать из IMDB, вы также можете предоставить свой собственный сюжет или изменить его, эти сюжеты примерно опишут основные части видео, а затем мы генерируем голос для каждого сюжета. Теперь, когда у нас есть разговорная часть трейлера, нам просто нужно взять короткие клипы, соответствующие каждому сюжету, и применить голос над ними, мы делаем это, отбирая множество кадров из видео и взяв некоторые из наиболее похожих кадров на каждый сюжет, причем это у нас есть изображения, которые наилучшим образом представляют каждый сюжет, следующим шагом будет принять клип из нескольких секунд, начинающийся с каждого кадра. После создания аудио и визуальной части трейлера, нам просто нужно объединить каждый звук с соответствующим клипом и, наконец, соединить все клипы вместе с финальным трейлером.

Все эти шаги будут генерировать промежуточные файлы, которые вы можете проверить, и вручную удалить то, что вам не нравится, чтобы улучшить результаты.

ПРИМЕЧАНИЕ. С параметрами по умолчанию для каждого сюжета только один аудио и один клип будет создан таким образом, создавая только один кандидат в трейлер. Если вы хотите создать больше кандидатов в трейлер или у вас есть больше вариантов аудио и клипов, которые вы можете увеличить, вы можете увеличить n_audios и n_retrieved_images , просто имейте в виду, что кандидаты в трейлер геометрично увеличивают это, для n_audios = 3 и n_retrieved_images = 3 у вас будет 9 (3 ** 3).

Примеры

Ночь живых мертвецов (1968)

Nosferatu (1922)

Парадокс Ферми - где все инопланетяне?

Музей естественной истории (новая выставка динозавров) Пешеходная экскурсия в 4K - Вашингтон, округ Колумбия

Изменение

2024/03/03 - Добавлена поддержка для создания трейлеров для любого видео не только фильмов.
2024/03/07 - Добавлена поддержка для загрузки видео с YouTube.

Использование

Рекомендуемый подход для использования этого репозитория с Docker, но вы также можете использовать пользовательский Venv, просто убедитесь, что установите все зависимости.

Пользователю необходимо предоставить только два входа : видеофайл и IMDB идентификатор из этого видео. После этого вы можете перейти в файл configs.yaml и соответствующим образом настроить значения, video_id будет идентификатором IMDB, а video_path должен указывать на файл видео, вы также можете обновить project_name на имя вашего видео и предоставить ссылочный голос с помощью reference_voice_path .

Как получить идентификатор IMDB для видео?

URL -адрес любого фильма в IMDB будет выглядеть как этот «https://www.imdb.com/title/tt0063350», идентификатор станет целым числом за title/ , в данном случае для «Ночи живых мертвецов», это будет 0063350 , IMDB, главным образом, имеет информацию о фильме, но вы также можете найти серии и другие видео.

Приложение рабочий процесс

Понимание видео (необязательно): Загрузите видео с YouTube
Поиск сюжета (необязательно): получить сюжет видео от IMDB
Расщепление сюжета: разделить график на сюжеты
Генерация голоса: генерируйте голос для каждого сюжета
Отбор проб кадров: попробовать несколько кадров из видео
Ранки кадров: выберите кадры, наиболее похожие на каждый сюжет
CLIP: Создайте видеоклип для каждой из выбранных кадров
Audio Clip: добавьте голос, сгенерированный на шаге 2 в каждый соответствующий клип
Присоединяйтесь к Clip: Присоединяйтесь к всем аудиоклипам, чтобы построить трейлер

Конфигурации

 project_dir: 'projects'
project_name: Natural_History_Museum
video_path: 'movies/Natural_History_Museum.mp4'
plot_filename: 'plot.txt'
video_retrieval:
  video_url: 'https://www.youtube.com/watch?v=fdcEKPS6tOQ'
plot_retrieval:
  video_id: 
subplot:
  split_char:
voice:
  model_id: 'tts_models/multilingual/multi-dataset/xtts_v2'
  device: cpu
  reference_voice_path: 'voices/sample_voice.wav'
  tts_language: en
  n_audios: 1
frame_sampling:
  n_frames: 500
frame_ranking:
  model_id: 'clip-ViT-B-32'
  device: cpu
  n_retrieved_images: 1
  similarity_batch_size: 128
clip:
  min_clip_len: 3
audio_clip:
  clip_volume: 0.1
  voice_volume: 1.0

Project_dir : папка, в которой будут размещены все ваши проекты
Project_name : имя проекта и основная папка, это может быть любое имя, которое вы хотите
video_path : путь к видеофайлу
plot_filename : имя файла, которое сохранит видео -сюжет
video_retrieval :
- video_url : необязательный URL с видео на YouTube
plot_retrieval :
- video_id : необязательный идентификатор IMDB для видео
SUBPLOT :
- split_char : необязательный символ, используемый для разделения текста сюжета
голос :
- Model_id : идентификатор режима TTS, здесь я использую Coqui AI
- Устройство : устройства, используемые моделями TTS и сходства, обычно один из (ЦП, CUDA, MP)
- reference_voice_path : путь к справочному аудиофайлу (голос, который будет клонирован)
- tts_language : языковой ввод для модели TTS
- n_audios : количество аудио
frame_sampling :
- n_frames : количество кадров для образец из видео
frame_ranking :
- model_id : модель сходства, используемая для ранжирования кадров
- Устройство : устройства, используемые моделями TTS и сходства, обычно один из (ЦП, CUDA, MP)
- N_RETRED_IMAGE
- searnity_batch_size : размер партии, используемый моделью сходства для встраивания кадров
клип :
- min_clip_len : минимальная длина клипа
audio_clip :
- clip_volume : процент исходного тома клипа, который будет сохранен для окончательного клипа
- Voice_volume : процент сгенерированного голоса громкости, который будет сохранен для окончательного клипа

Команды

Создайте изображение Docker

make build

Запустите весь трубопровод, чтобы создать трейлер, начиная с видео и сюжета

make trailer

Запустите весь трубопровод, чтобы создать трейлер, начиная с видео и извлечь сюжет из IMDB

make trailer_imdb

Запустите весь конвейер, чтобы создать трейлер, начиная с сюжета и загрузить видео с YouTube

make trailer_youtube

Запустите весь конвейер, чтобы создать трейлер, загружающий видео с YouTube и получение сюжета из IMDB

make trailer_imdb_youtube

Запустите шаг поиска видео

make video_retrieval

Запустить шаг поиска сюжета

make plot_retrieval

Запустить шаг подзасконского участка

make subplot

Запустить шаг голоса

make voice

Запустите шаг кадра (выборка кадра)

make frame

Запустите шаг Image_retrieval (рейтинг кадров)

make image_retrieval

Запустите шаг клипа

make clip

Запустите шаг audio_clip

make audio_clip

Запустите шаг join_clip

make join_clip

Применить ворс и форматирование к коду (необходимо только для разработки)

make lint

Разработка

Для разработки обязательно установите requirements-dev.txt и запустить make lint для поддержания стиля кодирования.

Отказ от ответственности

По умолчанию я использую XTTS из Coqui AI, модель находится по лицензии Coqui Public Model, обязательно посмотрите, если вы планируете использовать выходы здесь.

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-03-08
размер 555.18KB
От Github

Связанные приложения

ai_trailer

Автоматическое генерация трейлеров с использованием искусственного интеллекта

Я написал пару сообщений в блоге, связанном с этим проектом, обязательно их проверьте

Я также адаптировал этот проект для конкуренции «Google - Gemini Long».

Как это работает?

Примеры

Ночь живых мертвецов (1968)

Nosferatu (1922)

Парадокс Ферми - где все инопланетяне?

Музей естественной истории (новая выставка динозавров) Пешеходная экскурсия в 4K - Вашингтон, округ Колумбия

Изменение

Использование

Как получить идентификатор IMDB для видео?

Приложение рабочий процесс

Конфигурации

Команды

Разработка

Отказ от ответственности

OpenCore_NO_ACPI_Build

nspanel_pro_tools_apk

zkwork_aleo_gpu_worker

Один взгляд ИИ

ИИ-девушка

AI рисунок

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express