Unduh ai_trailer - Unduh Kode Sumber ai

ai_trailer

Kode sumber lainnya

1.0.0

Unduh

Pembuatan trailer otomatis menggunakan AI

Saya telah menulis beberapa posting blog yang terkait dengan proyek ini, pastikan untuk memeriksanya

Membuat trailer film dengan AI menggambarkan proyek secara lebih rinci
Menggunakan Gemini 1.5 Pro untuk membuat trailer video mengeksplorasi penggunaan kemampuan video Gemini 1.5 Pro pada proyek yang sama ini

Saya juga mengadaptasi proyek ini untuk kompetisi Kaggle "Google - Gemini Long Context", jika Anda ingin melihat kontennya, periksa tautan di bawah ini

Ringkas video walkthrough
Video Walkthrough Lengkap
Kaggle Notebook
Google Colab Notebook

Gagasan repositori ini adalah untuk secara otomatis menghasilkan sejumlah kandidat trailer untuk video yang diberikan, pengguna hanya perlu menyediakan file video dan beberapa parameter teks, dan yang lainnya dirawat.

Bagaimana cara kerjanya?

Pertama, kami secara opsional mengambil plot video di IMDB dan membaginya menjadi subplot, alih -alih mengambil dari IMDB, Anda juga dapat memberikan plot Anda sendiri atau memodifikasinya, subplot tersebut akan secara kasar menggambarkan bagian -bagian utama dari video, dan selanjutnya, kami menghasilkan suara untuk setiap subplot. Sekarang kita memiliki bagian lisan dari trailer, kita hanya perlu mengambil klip pendek yang sesuai dengan setiap subplot dan menerapkan suara di atasnya, kita melakukan ini dengan mencicipi banyak frame dari video dan mengambil beberapa bingkai yang paling mirip untuk setiap subplot, dengan ini kita memiliki gambar yang paling mewakili setiap subplot, langkah berikutnya adalah mengambil klip dari beberapa detik dari setiap bingkai. Setelah menghasilkan bagian audio dan visual dari trailer, kami hanya perlu menggabungkan setiap audio dengan klip yang sesuai dan akhirnya bergabung dengan semua klip bersama ke trailer akhir.

Semua langkah itu akan menghasilkan file menengah yang dapat Anda periksa dan secara manual menghapus apa yang tidak Anda sukai untuk meningkatkan hasilnya.

Catatan: Dengan parameter default, untuk setiap subplot hanya satu audio dan satu klip yang akan dihasilkan sehingga hanya membuat satu kandidat trailer. Jika Anda ingin membuat lebih banyak kandidat trailer atau memiliki lebih banyak opsi audio dan klip untuk dipilih, Anda dapat meningkatkan n_audios dan n_retrieved_images , perlu diingat bahwa kandidat trailer meningkatkan secara geometri dengan ini, untuk n_audios = 3 dan n_retrieved_images = 3 Anda akan memiliki 9 (3 ** 3) TRAILOT.

Contoh

Night of the Living Dead (1968)

Nosferatu (1922)

Paradoks Fermi - Di mana semua alien?

Museum Sejarah Alam (Pameran Dinosaurus Baru) Tur Jalan kaki di 4K - Washington, DC

Changelog

2024/03/03 - Menambahkan dukungan untuk membuat trailer untuk video apa pun tidak hanya film.
2024/03/07 - Menambahkan dukungan untuk mengunduh video dari YouTube.

Penggunaan

Pendekatan yang disarankan untuk menggunakan repositori ini adalah dengan Docker, tetapi Anda juga dapat menggunakan VENV khusus, pastikan untuk menginstal semua dependensi.

Pengguna hanya perlu memberikan dua input , file video dan ID IMDB dari video itu. Setelah itu Anda dapat pergi ke file configs.yaml dan menyesuaikan nilainya sesuai, video_id akan menjadi ID IMDB, dan video_path harus menunjuk ke file video, Anda mungkin juga ingin memperbarui project_name ke nama video Anda dan memberikan suara referensi dengan reference_voice_path .

Bagaimana cara mendapatkan ID IMDB untuk video?

URL film mana pun di IMDB akan terlihat seperti ini "https://www.imdb.com/title/tt0063350", ID akan menjadi bagian integer setelah title/ , dalam hal ini untuk "Night of the Living Dead" akan menjadi 0063350 , IMDB terutama memiliki informasi film tetapi Anda juga dapat menemukan seri 0063350.

Alur kerja aplikasi

Video Retrieval (Opsional): Unduh video dari YouTube
Plot Retrieval (Opsional): Dapatkan plot video dari IMDB
Subplot Split: Pisahkan plot menjadi subplot
Generasi Suara: menghasilkan suara untuk setiap subplot
Bingkai Pengambilan Sampel: Contoh beberapa frame dari video
Peringkat bingkai: Pilih bingkai yang paling mirip dengan setiap subplot
Klip: Buat klip video untuk setiap bingkai yang dipilih
Klip Audio: Tambahkan suara yang dihasilkan pada langkah 2 untuk setiap klip yang sesuai
Bergabunglah dengan klip: Bergabunglah dengan semua klip audio untuk membangun trailer

Konfigurasi

 project_dir: 'projects'
project_name: Natural_History_Museum
video_path: 'movies/Natural_History_Museum.mp4'
plot_filename: 'plot.txt'
video_retrieval:
  video_url: 'https://www.youtube.com/watch?v=fdcEKPS6tOQ'
plot_retrieval:
  video_id: 
subplot:
  split_char:
voice:
  model_id: 'tts_models/multilingual/multi-dataset/xtts_v2'
  device: cpu
  reference_voice_path: 'voices/sample_voice.wav'
  tts_language: en
  n_audios: 1
frame_sampling:
  n_frames: 500
frame_ranking:
  model_id: 'clip-ViT-B-32'
  device: cpu
  n_retrieved_images: 1
  similarity_batch_size: 128
clip:
  min_clip_len: 3
audio_clip:
  clip_volume: 0.1
  voice_volume: 1.0

Project_dir : folder yang akan meng -host semua proyek Anda
Project_name : Nama proyek dan folder utama, itu bisa menjadi nama apa pun yang Anda inginkan
Video_path : Path to the Video File
Plot_filename : Nama file yang akan menyimpan plot video
Video_retrieval :
- Video_url : URL opsional dari video YouTube
PLOT_RETRIEVAL :
- Video_id : ID IMDB opsional untuk video
Subplot :
- split_char : karakter opsional yang digunakan untuk membagi teks plot
suara :
- Model_id : ID mode TTS, di sini saya menggunakan Coqui AI
- Perangkat : Perangkat yang digunakan oleh TT dan model kesamaan, biasanya salah satu (CPU, CUDA, MPS)
- Reference_voice_path : jalur ke file audio referensi (suara yang akan dikloning)
- TTS_LUUGE : Input bahasa untuk model TTS
- N_Audios : Jumlah audio yang akan dihasilkan per subplot
frame_sampling :
- N_FRAMES : Jumlah frame untuk dicicipi dari video
frame_ranking :
- model_id : Model kesamaan yang digunakan untuk memberi peringkat bingkai
- Perangkat : Perangkat yang digunakan oleh TT dan model kesamaan, biasanya salah satu (CPU, CUDA, MPS)
- n_retrieved_images : Jumlah frame yang diambil per subplot
- kesamaan_batch_size : ukuran batch yang digunakan oleh model kesamaan untuk menanamkan bingkai
Klip :
- min_clip_len : Panjang minimum klip
audio_clip :
- clip_volume : persentase volume klip asli yang harus disimpan untuk klip akhir
- voice_volume : persentase dari volume suara yang dihasilkan untuk disimpan untuk klip akhir

Perintah

Bangun gambar Docker

make build

Jalankan seluruh pipa untuk membuat trailer mulai dari video dan plot

make trailer

Jalankan seluruh pipa untuk membuat trailer mulai dari video dan mengambil plot dari IMDB

make trailer_imdb

Jalankan seluruh pipa untuk membuat trailer mulai dari plot dan mengunduh video dari YouTube

make trailer_youtube

Jalankan seluruh pipa untuk membuat trailer yang mengunduh video dari YouTube dan mengambil plot dari IMDB

make trailer_imdb_youtube

Jalankan langkah pengambilan video

make video_retrieval

Jalankan langkah pengambilan plot

make plot_retrieval

Jalankan langkah subplot

make subplot

Jalankan Langkah Suara

make voice

Jalankan langkah bingkai (bingkai pengambilan sampel)

make frame

Jalankan Langkah Image_Retrieval (peringkat bingkai)

make image_retrieval

Jalankan langkah klip

make clip

Jalankan langkah audio_clip

make audio_clip

Jalankan langkah join_clip

make join_clip

Terapkan serat dan pemformatan ke kode (hanya diperlukan untuk pengembangan)

make lint

Perkembangan

Untuk pengembangan, pastikan untuk menginstal requirements-dev.txt dan jalankan, make lint untuk mempertahankan gaya pengkodean.

Penafian

Secara default saya menggunakan xtts dari coqui ai model ini di bawah lisensi model publik coqui pastikan untuk melihat di sana jika Anda berencana untuk menggunakan output di sini.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-03-08
ukuran 555.18KB
Berasal dari Github

Aplikasi Terkait

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
Sekilas AI

2023-10-24
gadis AI

2023-10-24
menggambar AI

2023-10-24

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua