ดาวน์โหลด MOFA Video - ดาวน์โหลดซอร์สโค้ด MOFA Video

MOFA Video

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

? ️ MOFA-VIDEO: ภาพเคลื่อนไหวของภาพที่ควบคุมได้ผ่านการปรับตัวของฟิลด์การเคลื่อนไหวแบบกำเนิดในรูปแบบการแพร่กระจายภาพแช่แข็งไปยังวิดีโอ (ECCV 2024)

Muyao Niu ^1,2 Xiaodong Cun ^2,* Xintao Wang ² Yong Zhang ² Ying Shan ² Yinqiang Zheng ^1,*

¹ มหาวิทยาลัยโตเกียว ² Tencent Ai Lab ^* ผู้เขียนที่เกี่ยวข้อง

ใน การประชุมยุโรปเรื่องวิสัยทัศน์คอมพิวเตอร์ (ECCV) 2024

คุณสมบัติใหม่/การอัปเดต

(2024.08.07) เราได้เปิดตัวสคริปต์การอนุมานสำหรับภาพเคลื่อนไหวภาพใบหน้าที่ใช้กุญแจ! โปรดดูที่นี่สำหรับคำแนะนำเพิ่มเติม
(2024.07.15) เราได้เปิดตัวรหัสการฝึกอบรมสำหรับภาพเคลื่อนไหวรูปภาพที่ใช้วิถี! โปรดดูที่นี่สำหรับคำแนะนำเพิ่มเติม
Mofa-Video จะปรากฏใน ECCV 2024! -
เราได้เปิดตัวรหัสการอนุมาน Gradio และจุดตรวจสำหรับการควบคุม ไฮบริด ! โปรดดูที่นี่สำหรับคำแนะนำเพิ่มเติม
ฟรีการสาธิตออนไลน์ผ่านช่องว่าง HuggingFace จะมาเร็ว ๆ นี้!
หากคุณพบว่างานนี้น่าสนใจโปรดอย่าลังเลที่จะให้!

- การเปิดตัวรหัส

(2024.05.31) การสาธิต gradio และจุดตรวจสำหรับภาพเคลื่อนไหวรูปภาพที่ใช้วิถี
(2024.06.22) การสาธิต gradio และจุดตรวจสอบสำหรับภาพเคลื่อนไหวรูปภาพด้วยการควบคุมไฮบริด
(2024.07.15) สคริปต์การฝึกอบรมสำหรับภาพเคลื่อนไหวรูปภาพที่ใช้วิถี
(2024.08.07) สคริปต์การอนุมานและจุดตรวจสอบสำหรับภาพเคลื่อนไหวภาพใบหน้าที่ใช้กุญแจ
สคริปต์การฝึกอบรมสำหรับภาพเคลื่อนไหวบนใบหน้า

tl; dr

Image? ️ + การควบคุมไฮบริด️ = วิดีโอ ??


วิถี + การควบคุมสถานที่สำคัญ


การควบคุมวิถี


การควบคุมสถานที่สำคัญ

ตรวจสอบแกลเลอรี่ของหน้าโครงการของเราเพื่อดูผลลัพธ์ที่ได้จากการมองเห็นเพิ่มเติม!

การแนะนำ

เราแนะนำ Mofa-Video ซึ่งเป็นวิธีการที่ออกแบบมาเพื่อปรับการเคลื่อนไหวจากโดเมนที่แตกต่างกันไปยังรูปแบบการแพร่กระจายวิดีโอแช่แข็ง ด้วยการใช้การสร้างการเคลื่อนไหวแบบกระจัดกระจาย (S2D) และการปรับการเคลื่อนไหวแบบไหลออกมา MOFA-Video สามารถทำให้ภาพเดียวมีประสิทธิภาพโดยใช้สัญญาณควบคุมประเภทต่างๆได้อย่างมีประสิทธิภาพรวมถึงวิถีการเคลื่อนที่ลำดับคีย์พอยท์และชุดค่าผสมของพวกเขา

ในระหว่างขั้นตอนการฝึกอบรมเราสร้างสัญญาณการควบคุมที่กระจัดกระจายผ่านการสุ่มตัวอย่างการเคลื่อนไหวแบบเบาบางจากนั้นฝึกอบรม MOFA-adapters ที่แตกต่างกันเพื่อสร้างวิดีโอผ่าน SVD ที่ผ่านการฝึกอบรมมาก่อน ในระหว่างขั้นตอนการอนุมาน MOFA-adapters ที่แตกต่างกันสามารถรวมกันเพื่อควบคุม SVD แช่แข็งร่วมกัน

️ภาพเคลื่อนไหวรูปภาพพร้อมตัวควบคุมไฮบริด

1. โคลนที่เก็บ

 git clone https://github.com/MyNiuuu/MOFA-Video.git
cd ./MOFA-Video

2. การตั้งค่าสภาพแวดล้อม

การสาธิตได้รับการทดสอบในรุ่น CUDA ที่ 11.7

 cd ./MOFA-Video-Hybrid
conda create -n mofa python==3.10
conda activate mofa
pip install -r requirements.txt
pip install opencv-python-headless
pip install "git+https://github.com/facebookresearch/pytorch3d.git"

สำคัญ: รุ่น Gradio ที่ 4.5.0 ใน requirements.txt ควรติดตามอย่างเคร่งครัดเนื่องจากเวอร์ชันอื่นอาจทำให้เกิดข้อผิดพลาด

3. การดาวน์โหลดจุดตรวจ

ดาวน์โหลดจุดตรวจของ CMP จากที่นี่และใส่ลงใน ./MOFA-Video-Hybrid/models/cmp/experiments/semiauto_annot/resnet50_vip+mpii_liteflow/checkpoints mofa-video-hybrid/models/cmp/experiments/Semiauto_annot/resnet50_vip+mpii_liteflow/checkpoints
ดาวน์โหลดโฟลเดอร์ ckpts จาก repo huggingface ซึ่งมีจุดตรวจสอบที่จำเป็นและวางไว้ใต้ ./MOFA-Video-Hybrid mofa-Video-Hybrid คุณสามารถใช้ git lfs เพื่อดาวน์โหลดโฟลเดอร์ ckpts ทั้งหมด :
1. ดาวน์โหลด git lfs จาก https://git-lfs.github.com มันมักจะใช้สำหรับการโคลนที่เก็บด้วยจุดตรวจขนาดใหญ่บน HuggingFace
2. ดำเนินการ git clone https://huggingface.co/MyNiuuu/MOFA-Video-Hybrid เพื่อดาวน์โหลดที่เก็บ HuggingFace ที่สมบูรณ์ซึ่งปัจจุบันรวมถึงโฟลเดอร์ ckpts เท่านั้น
3. คัดลอกหรือย้ายโฟลเดอร์ ckpts ไปยังที่เก็บ GitHub
หมายเหตุ: หากคุณพบข้อผิดพลาด git: 'lfs' is not a git command บน Linux คุณสามารถลองโซลูชันนี้ที่ทำงานได้ดีสำหรับกรณีของฉัน
ในที่สุดจุดตรวจควรได้รับการจัดเรียงเป็น ./MOFA-Video-Hybrid/ckpt_tree.md

4. เรียกใช้การสาธิต gradio

ใช้เสียงเพื่อเคลื่อนไหวส่วนใบหน้า

 cd ./MOFA-Video-Hybrid
python run_gradio_audio_driven.py

- อินเทอร์เฟซ gradio จะปรากฏขึ้นด้านล่าง โปรดดูคำแนะนำเกี่ยวกับอินเทอร์เฟซ Gradio ในระหว่างกระบวนการอนุมาน!

การใช้วิดีโออ้างอิงเพื่อเคลื่อนไหวส่วนใบหน้า

 cd ./MOFA-Video-Hybrid
python run_gradio_video_driven.py

- อินเทอร์เฟซ gradio จะปรากฏขึ้นด้านล่าง โปรดดูคำแนะนำเกี่ยวกับอินเทอร์เฟซ Gradio ในระหว่างกระบวนการอนุมาน!

- ภาพเคลื่อนไหวรูปภาพที่ใช้วิถี

โปรดดูคำแนะนำที่นี่

การฝึกอบรม Mofa-Adapter ของคุณเอง

โปรดดูที่นี่สำหรับคำแนะนำเพิ่มเติม

การอ้างอิง

 @article{niu2024mofa,
  title={MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Video Diffusion Model},
  author={Niu, Muyao and Cun, Xiaodong and Wang, Xintao and Zhang, Yong and Shan, Ying and Zheng, Yinqiang},
  journal={arXiv preprint arXiv:2405.20222},
  year={2024}
}

กิตติกรรมประกาศ

เราขอขอบคุณอย่างจริงใจในการเปิดตัวรหัสของโครงการต่อไปนี้: Dragnuwa, Sadtalker, Aniportrait, diffusers, SVD_XTEND, การตั้งค่าการเคลื่อนไหวตามเงื่อนไขและ unimatch

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-03-09
ขนาด 86.49MB
มาจาก Github

แอปที่เกี่ยวข้อง

YouTube Video Downloader

2024-11-10
แอพวิดีโอรีล

2024-03-30
วิดีโอคนแปลกหน้า

2024-02-23
วิดีโอสตาร์หุ่นยนต์

2023-07-13
Ritmo วิดีโอเวอร์ชัน Android

2023-06-26
ซอฟต์แวร์ toonify วิดีโอ

2023-05-24

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด