Unduh MOFA Video - Unduh Kode Sumber MOFA Video

MOFA Video

Kode sumber lainnya

1.0.0

Unduh

? ️ MOFA-Video: Animasi gambar yang dapat dikendalikan melalui adaptasi bidang gerak generatif dalam model difusi gambar-ke-video beku (ECCV 2024)

Muyao niu ^1,2 xiaodong cun ^2,* xintao wang ² yong zhang ² ying shan ² yinqiang zheng ^1,*

¹ The University of Tokyo ² Tencent AI Lab ^* Penulis yang sesuai

Dalam Konferensi Eropa tentang Visi Komputer (ECCV) 2024

Fitur/Pembaruan Baru

(2024.08.07) Kami telah merilis skrip inferensi untuk animasi gambar wajah berbasis keypoint! Silakan merujuk di sini untuk instruksi lebih lanjut.
(2024.07.15) Kami telah merilis kode pelatihan untuk animasi gambar berbasis lintasan! Silakan merujuk di sini untuk instruksi lebih lanjut.
MOFA-Video akan muncul di ECCV 2024! ??????
Kami telah merilis kode inferensi gradio dan pos pemeriksaan untuk kontrol hybrid ! Silakan merujuk di sini untuk instruksi lebih lanjut.
Demo online gratis melalui ruang pelukan akan segera hadir!
Jika Anda menganggap pekerjaan ini menarik, jangan ragu untuk memberikan!

? Rilis Kode

(2024.05.31) Demo dan pos pemeriksaan gradio untuk animasi gambar berbasis lintasan
(2024.06.22) Demo dan pos pemeriksaan gradio untuk animasi gambar dengan kontrol hybrid
(2024.07.15) Script Pelatihan untuk Animasi Gambar Berbasis Lintasan
(2024.08.07) Skrip inferensi dan pos pemeriksaan untuk animasi gambar wajah berbasis keypoint
Skrip Pelatihan untuk Animasi Gambar Wajah Berbasis Keypoint

Tl; dr

Gambar? ️ + Kontrol Hibrida? ️ = Video ??


Lintasan + Kontrol Landmark


Kontrol lintasan


Kontrol tengara

Periksa galeri halaman proyek kami untuk lebih banyak hasil visual!

Perkenalan

Kami memperkenalkan MOFA-Video, metode yang dirancang untuk mengadaptasi gerakan dari domain yang berbeda ke model difusi video beku. Dengan menggunakan generasi gerak yang jarang (S2D) dan adaptasi gerak berbasis aliran, MOFA-Video dapat secara efektif menghidupkan satu gambar tunggal menggunakan berbagai jenis sinyal kontrol, termasuk lintasan, urutan keypoint, dan kombinasi mereka.

Selama tahap pelatihan, kami menghasilkan sinyal kontrol yang jarang melalui pengambilan sampel gerak yang jarang dan kemudian melatih adapter MOFA yang berbeda untuk menghasilkan video melalui SVD pra-terlatih. Selama tahap inferensi, adapter MOFA yang berbeda dapat digabungkan untuk secara bersama-sama mengontrol SVD beku.

? ️ Animasi gambar dengan kontrol hibrida

1. Kloning repositori

 git clone https://github.com/MyNiuuu/MOFA-Video.git
cd ./MOFA-Video

2. Pengaturan Lingkungan

Demo telah diuji pada versi CUDA 11.7.

 cd ./MOFA-Video-Hybrid
conda create -n mofa python==3.10
conda activate mofa
pip install -r requirements.txt
pip install opencv-python-headless
pip install "git+https://github.com/facebookresearch/pytorch3d.git"

PENTING: ️ ️ ️ Versi gradio 4.5.0 dalam requirements.txt harus diikuti secara ketat karena versi lain dapat menyebabkan kesalahan.

3. Mengunduh pos pemeriksaan

Unduh pos pemeriksaan CMP dari sini dan masukkan ke dalam ./MOFA-Video-Hybrid/models/cmp/experiments/semiauto_annot/resnet50_vip+mpii_liteflow/checkpoints .
Unduh folder ckpts dari Repo Huggingface yang berisi pos pemeriksaan pretrained yang diperlukan dan letakkan di bawah ./MOFA-Video-Hybrid . Anda dapat menggunakan git lfs untuk mengunduh seluruh folder ckpts :
1. Unduh git lfs dari https://git-lfs.github.com. Ini umumnya digunakan untuk kloning repositori dengan pos pemeriksaan model besar di Huggingface.
2. Jalankan git clone https://huggingface.co/MyNiuuu/MOFA-Video-Hybrid untuk mengunduh repositori pelukan lengkap, yang saat ini hanya menyertakan folder ckpts .
3. Salin atau pindahkan folder ckpts ke repositori GitHub.
Catatan: Jika Anda menemukan kesalahan git: 'lfs' is not a git command di Linux, Anda dapat mencoba solusi ini yang telah bekerja dengan baik untuk kasus saya.
Akhirnya, pos pemeriksaan harus diorganisasi sebagai ./MOFA-Video-Hybrid/ckpt_tree.md .

4. Jalankan Demo Gradio

Menggunakan audio untuk menghidupkan bagian wajah

 cd ./MOFA-Video-Hybrid
python run_gradio_audio_driven.py

??? Antarmuka gradio ditampilkan seperti di bawah ini. Silakan merujuk pada instruksi di antarmuka clashio selama proses inferensi!

Menggunakan video referensi untuk menghidupkan bagian wajah

 cd ./MOFA-Video-Hybrid
python run_gradio_video_driven.py

??? Antarmuka gradio ditampilkan seperti di bawah ini. Silakan merujuk pada instruksi di antarmuka clashio selama proses inferensi!

? Animasi gambar berbasis lintasan

Silakan merujuk di sini untuk instruksi.

Melatih adaptor mofa Anda sendiri

Silakan merujuk di sini untuk instruksi lebih lanjut.

Kutipan

 @article{niu2024mofa,
  title={MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Video Diffusion Model},
  author={Niu, Muyao and Cun, Xiaodong and Wang, Xintao and Zhang, Yong and Shan, Ying and Zheng, Yinqiang},
  journal={arXiv preprint arXiv:2405.20222},
  year={2024}
}

Ucapan Terima Kasih

Kami dengan tulus menghargai rilis kode dari proyek-proyek berikut: Dragnuwa, Sadtalker, Aniportrait, Diffusers, SVD_XTEND, propagasi-gerak kondisional, dan unimatch.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-03-09
ukuran 86.49MB
Berasal dari Github

Aplikasi Terkait

YouTube Video Downloader

2024-11-10
aplikasi video gulungan

2024-03-30
Video Asing

2024-02-23
bintang video android

2023-07-13
Ritmo Video versi Android

2023-06-26
perangkat lunak toonify video

2023-05-24

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua