ai_trailerダウンロードai_trailerソースコードのダウンロード

ai_trailer

その他のソースコード

1.0.0

ダウンロード

AIを使用した自動トレーラー生成

このプロジェクトに関連するいくつかのブログ投稿を書いたことがあります。

AIを使用して映画の予告編を作成すると、プロジェクトについてさらに詳しく説明します
Gemini 1.5 Proを使用してビデオ予告編を作成すると、この同じプロジェクトでGemini 1.5 Proビデオ機能の使用を探ります

また、このプロジェクトを「Google -Gemini Long Context」Kaggleコンペティションに適合させました。コンテンツを見てみたい場合は、以下のリンクをチェックアウトします

要約されたウォークスルービデオ
完全なウォークスルービデオ
Kaggleノートブック
Google Colabノートブック

このリポジトリのアイデアは、特定のビデオの多くのトレーラー候補を自動的に生成することです。ユーザーはビデオファイルといくつかのテキストパラメーターを提供するだけで、他のすべてが注意してください。

それはどのように機能しますか？

まず、オプションでIMDBでビデオのプロットを取得してサブプロットに分割します。IMDBから取得する代わりに、独自のプロットを提供したり変更したりすることもできます。これらのサブプロットは、ビデオの主要部分を大まかに説明し、次に各サブプロットの音声を生成します。トレーラーの音声部分が作成されたので、各サブプロットに対応する短いクリップを撮影し、それらの上に音声を適用する必要があります。これをビデオからサンプリングし、各サブプロットに最も類似したフレームをサンプリングすることでこれを行います。トレーラーのオーディオとビジュアル部分を生成した後、各オーディオと対応するクリップを組み合わせて、最後にすべてのクリップを最終トレーラーに結合する必要があります。

これらの手順はすべて、結果を改善するのが嫌いなものを検査して削除できる中間ファイルを生成します。

注：デフォルトのパラメーターを使用すると、各サブプロットに対して1つのオーディオと1つのクリップのみが生成されるため、1つのトレーラー候補を作成します。より多くのトレーラー候補を作成したい場合、または選択できるオーディオとクリップのオプションが増えたい場合は、 n_audiosとn_retrieved_imagesを増やすことができます。トレーラー候補者は、 n_audios = 3およびn_retrieved_images = 3の場合、これにより幾何学的に増加することに注意してください。

例

ナイトオブザリビングデッド（1968）

ノスフェラトゥ（1922）

フェルミパラドックス - すべてのエイリアンはどこにいますか？

Natural History Museum（New Dinosaur展示）4Kのウォーキングツアー - ワシントンDC

Changelog

2024/03/03-映画だけでなく、あらゆるビデオのトレーラーを作成するためのサポートを追加しました。
2024/03/07- YouTubeからビデオをダウンロードするためのサポートを追加しました。

使用法

このリポジトリを使用するための推奨されるアプローチはDockerを使用していますが、カスタムVENVを使用することもできます。すべての依存関係をインストールしてください。

ユーザーは、ビデオファイルとそのビデオからIMDB IDの2つの入力のみを提供する必要があります。その後、 configs.yamlファイルに移動して値を調整することができます。それに応じて、 video_id IMDB IDになり、 video_pathビデオのファイルを指す必要があります。また、 project_nameビデオの名前に更新し、 reference_voice_pathで参照音声を提供することもできます。

ビデオのIMDB IDを取得する方法は？

IMDBでの映画のURLは、この「https://www.imdb.com/title/tt0063350」のように見え0063350 。IDは、「Living Deadの夜」の場合はtitle/の後の整数部になります。

アプリケーションワークフロー

ビデオ検索（オプション）： YouTubeからビデオをダウンロードします
プロット検索（オプション）： IMDBからビデオのプロットを取得します
サブプロット分割：プロットをサブプロットに分割します
音声生成：各サブプロットの音声を生成します
フレームサンプリング：ビデオの複数のフレームをサンプリングします
フレームランキング：各サブプロットに最も似たフレームを選択します
クリップ：選択したフレームごとにビデオクリップを作成します
オーディオクリップ：ステップ2で生成された音声を各対応するクリップに追加します
クリップに参加：すべてのオーディオクリップに参加してトレーラーを構築します

構成

 project_dir: 'projects'
project_name: Natural_History_Museum
video_path: 'movies/Natural_History_Museum.mp4'
plot_filename: 'plot.txt'
video_retrieval:
  video_url: 'https://www.youtube.com/watch?v=fdcEKPS6tOQ'
plot_retrieval:
  video_id: 
subplot:
  split_char:
voice:
  model_id: 'tts_models/multilingual/multi-dataset/xtts_v2'
  device: cpu
  reference_voice_path: 'voices/sample_voice.wav'
  tts_language: en
  n_audios: 1
frame_sampling:
  n_frames: 500
frame_ranking:
  model_id: 'clip-ViT-B-32'
  device: cpu
  n_retrieved_images: 1
  similarity_batch_size: 128
clip:
  min_clip_len: 3
audio_clip:
  clip_volume: 0.1
  voice_volume: 1.0

Project_dir ：すべてのプロジェクトをホストするフォルダー
project_name ：プロジェクト名とメインフォルダー、それはあなたが望むあらゆる名前にすることができます
Video_Path ：ビデオファイルへのパス
plot_fileName ：ビデオプロットを保持するファイル名
video_retrieval ：
- Video_url ：YouTubeビデオのオプションのURL
plot_retrieval ：
- Video_ID ：ビデオのオプションIMDB ID
サブプロット：
- split_char ：プロットテキストを分割するために使用されるオプションの文字
声：
- Model_id ：TTSモードID、ここで私はコキアイを使用しています
- デバイス：TTSおよび類似性モデルで使用されるデバイス（通常はCPU、CUDA、MP）の1つ
- Reference_voice_path ：参照オーディオファイルへのパス（クローン化される音声）
- TTS_LANGUAGE ：TTSモデルの言語入力
- N_AUDIOS ：サブプロットごとに生成するオーディオの数
frame_sampling ：
- n_frames ：ビデオからサンプリングするフレームの数
frame_ranking ：
- Model_id ：フレームのランク付けに使用される類似性モデル
- デバイス：TTSおよび類似性モデルで使用されるデバイス（通常はCPU、CUDA、MP）の1つ
- n_retrieved_images ：サブプロットごとに検索したフレームの数
- 類似性_batch_size ：類似性モデルがフレームを埋め込むために使用されるバッチサイズ
クリップ：
- min_clip_len ：クリップの最小長
audio_clip ：
- Clip_Volume ：最終クリップのために保持される元のクリップボリュームの割合
- Voice_Volume ：最終クリップのために保持される生成された音声ボリュームの割合

コマンド

Docker画像を作成します

make build

パイプライン全体を実行して、ビデオとプロットから始まるトレーラーを作成します

make trailer

パイプライン全体を実行して、ビデオから始まり、IMDBからプロットを取得する予告編を作成します

make trailer_imdb

パイプライン全体を実行して、プロットから始まり、YouTubeからビデオをダウンロードするトレーラーを作成します

make trailer_youtube

パイプライン全体を実行して、YouTubeからビデオをダウンロードし、IMDBからプロットを取得するトレーラーを作成します

make trailer_imdb_youtube

ビデオ検索ステップを実行します

make video_retrieval

プロット検索ステップを実行します

make plot_retrieval

サブプロットステップを実行します

make subplot

音声ステップを実行します

make voice

フレームステップを実行します（フレームサンプリング）

make frame

image_retrievalステップ（フレームランキング）を実行する

make image_retrieval

クリップステップを実行します

make clip

audio_clipステップを実行します

make audio_clip

join_clipステップを実行します

make join_clip

糸くずとフォーマットをコードに適用します（開発にのみ必要です）

make lint

発達

開発のために、必ずrequirements-dev.txtをインストールし、 make lintを作成してコーディングスタイルを維持してください。

免責事項

デフォルトでは、Coqui AIのXTTSを使用しています。モデルはCoqui Public Modelライセンスの下にあります。ここで出力を使用する場合は、必ず確認してください。

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-03-08
サイズ 555.18KB
から Github

ai_trailer

AIを使用した自動トレーラー生成

このプロジェクトに関連するいくつかのブログ投稿を書いたことがあります。

また、このプロジェクトを「Google -Gemini Long Context」Kaggleコンペティションに適合させました。コンテンツを見てみたい場合は、以下のリンクをチェックアウトします

それはどのように機能しますか？

例

ナイトオブザリビングデッド（1968）

ノスフェラトゥ（1922）

フェルミパラドックス - すべてのエイリアンはどこにいますか？

Natural History Museum（New Dinosaur展示）4Kのウォーキングツアー - ワシントンDC

Changelog

使用法

ビデオのIMDB IDを取得する方法は？

アプリケーションワークフロー

構成

コマンド

発達

免責事項

OpenCore_NO_ACPI_Build

nspanel_pro_tools_apk

zkwork_aleo_gpu_worker

ひと目でわかるAI

AI少女

AI描画

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express