Download 3DDFA_V2 - Download Kode Sumber 3DDFA

3DDFA_V2

ular piton

v0.12 Release Notes

Unduh

Menuju penyelarasan wajah 3D padat yang cepat, akurat dan stabil

Oleh Jianzhu Guo, Xiangyu Zhu, Yang Yang, Fan Yang, Zhen Lei dan Stan Z. Li. Repo kode dimiliki dan dikelola oleh Jianzhu Guo .

demo

[Pembaruan]

2021.7.10 : Jalankan 3DDFA_V2 secara online di gradio.
2021.1.15 : Pinjam implementasi estimasi pose-head-head untuk rendering mesh yang lebih cepat (speedup sekitar 3x, 15ms-> 4ms), lihat utils/render_ctypes.py untuk detailnya.
2020.10.7 python3 latency.py --onnx
2020.10.6 --onnx
2020.10.2 . --onnx demo.py
2020.9.20 : Tambahkan fitur termasuk estimasi pose dan serialisasi ke .ply dan .obj, lihat pose , ply , opsi obj di demo.py.
2020.9.19 : Tambahkan PNCC (proyeksi kode koordinat yang dinormalisasi), fitur pemetaan tekstur UV, lihat pncc , opsi uv_tex di demo.py.

Perkenalan

Karya ini memperluas 3DDFA, bernama 3DDFA_V2 , berjudul menuju penyelarasan wajah 3D padat 3D yang cepat, akurat dan stabil, diterima oleh ECCV 2020. Bahan tambahan ada di sini. GIF di atas menunjukkan demo webcam dari hasil pelacakan, dalam skenario lab saya. Repo ini adalah implementasi resmi 3DDFA_V2.

Dibandingkan dengan 3DDFA, 3DDFA_V2 mencapai kinerja dan stabilitas yang lebih baik. Selain itu, 3DDFA_V2 menggabungkan facebox detektor wajah cepat alih -alih dlib. Render 3D sederhana yang ditulis oleh C ++ dan Cython juga disertakan. Repo ini mendukung onnxruntime, dan latensi regresi parameter 3DMM menggunakan tulang punggung default adalah sekitar 1,35ms/gambar pada CPU dengan satu gambar sebagai input. Jika Anda tertarik dengan repo ini, coba saja di Google Colab ini! Selamat datang untuk masalah, PRS, dan diskusi yang berharga?

Memulai

Persyaratan

Lihat persyaratan.txt, diuji pada platform macOS dan Linux. Pengguna Windows dapat merujuk ke FQA untuk membangun masalah. Perhatikan bahwa repo ini menggunakan Python3. Ketergantungan utama adalah Pytorch, Numpy, OpenCV-Python dan Onnxruntime, dll. Jika Anda menjalankan demo dengan --onnx FLAG untuk melakukan akselerasi, Anda mungkin perlu menginstal libomp terlebih dahulu, yaitu, brew install libomp pada macOS.

Penggunaan

Klone repo ini

git clone https://github.com/cleardusk/3DDFA_V2.git
cd 3DDFA_V2

Bangun versi Cython dari NMS, SIM3DR, dan render mesh yang lebih cepat

sh ./build.sh

Jalankan demo

 # 1. running on still image, the options include: 2d_sparse, 2d_dense, 3d, depth, pncc, pose, uv_tex, ply, obj
python3 demo.py -f examples/inputs/emma.jpg --onnx # -o [2d_sparse, 2d_dense, 3d, depth, pncc, pose, uv_tex, ply, obj]

# 2. running on videos
python3 demo_video.py -f examples/inputs/videos/214.avi --onnx

# 3. running on videos smoothly by looking ahead by `n_next` frames
python3 demo_video_smooth.py -f examples/inputs/videos/214.avi --onnx

# 4. running on webcam
python3 demo_webcam_smooth.py --onnx

Implementasi pelacakan hanya dengan penyelarasan. Jika kepala berpose> 90 ° atau gerakannya terlalu cepat, penyelarasan mungkin gagal. Ambang batas digunakan untuk dengan tegas memeriksa keadaan pelacakan, tetapi tidak stabil.

Anda dapat merujuk ke demo.ipynb atau Google Colab untuk tutorial langkah demi langkah berjalan pada gambar diam.

Misalnya, menjalankan python3 demo.py -f examples/inputs/emma.jpg -o 3d akan memberikan hasil di bawah ini:

demo

Contoh lain:

demo

Berjalan di video akan memberi:

demo

Lebih banyak hasil atau demo untuk dilihat: Hathaway.

Fitur (hingga sekarang)

2d jarang	2d padat	3d

Kedalaman	PNCC	Tekstur UV

Pose	Serialisasi ke .ply	Serialisasi ke .OBJ

Konfigurasi

Backbone default adalah MobileNet_V1 dengan ukuran input 120x120 dan bobot pra-terlatih default adalah weights/mb1_120x120.pth , ditunjukkan dalam configs/mb1_120x120.yml. Repo ini menyediakan konfigurasi lain di konfigurasi/MB05_120x120.yml, dengan faktor lebar 0,5, menjadi lebih kecil dan lebih cepat. Anda dapat menentukan opsi konfigurasi dengan -c atau --config . Model yang dilepaskan ditampilkan pada tabel di bawah ini. Perhatikan bahwa waktu inferensi pada CPU dalam kertas dievaluasi menggunakan TensorFlow.

Model	Masukan	#Params	#Macs	Inferensi (TF)
Mobilenet	120x120	3.27m	183.5m	~ 6.2ms
MobileNet x0.5	120x120	0.85m	49.5m	~ 2.9ms

Anehnya , latensi onnxruntime jauh lebih kecil. Waktu inferensi pada CPU dengan utas yang berbeda ditunjukkan di bawah ini. Hasilnya diuji pada MBP saya (I5-8259U CPU @ 2.30GHz pada MacBook Pro 13-inci), dengan versi 1.5.1 Onnxruntime. Nomor utas diatur oleh os.environ["OMP_NUM_THREADS"] , lihat speed_cpu.py untuk detail lebih lanjut.

Model	Thread = 1	Thread = 2	Thread = 4
Mobilenet	4.4ms	2,25ms	1,35ms
MobileNet x0.5	1,37ms	0.7ms	0,5 ms

Latensi

Opsi onnx sangat mengurangi latensi CPU keseluruhan, tetapi deteksi wajah masih memakan sebagian besar waktu latensi, misalnya, 15ms untuk gambar 720p. Regresi parameter 3DMM membutuhkan waktu sekitar 1 ~ 2ms untuk satu wajah, dan rekonstruksi padat (lebih dari 30.000 poin, yaitu 38.365) adalah sekitar 1 ms untuk satu wajah. Aplikasi pelacakan dapat mengambil manfaat dari kecepatan regresi 3DMM cepat, karena deteksi tidak diperlukan untuk setiap bingkai. Latensi diuji menggunakan MacBook Pro 13 inci saya (I5-8259U CPU @ 2.30GHz).

OMP_NUM_THREADS default adalah set 4, Anda dapat menentukannya dengan mengatur os.environ['OMP_NUM_THREADS'] = '$NUM' atau memasukkan export OMP_NUM_THREADS=$NUM sebelum menjalankan skrip python.

demo

FQA

Apa data pelatihannya?
Kami menggunakan 300W-LP untuk pelatihan. Anda dapat merujuk ke makalah kami untuk detail lebih lanjut tentang pelatihan. Karena beberapa gambar adalah mata tertutup dalam data pelatihan 300W-LP, landmark mata tidak akurat saat ditutup. Bagian mata dari demo webcam juga tidak baik.
Berjalan di windows.
Anda dapat merujuk komentar ini untuk membangun NMS di Windows.

Pengakuan

Modul facebox dimodifikasi dari facebox.pytorch.
Daftar karya sebelumnya tentang perataan atau rekonstruksi wajah padat 3D: 3DDFA, FACE3D, PRNET.
Terima kasih AK391 karena telah menjadi hosting aplikasi Web Gradio.

Implementasi atau aplikasi lainnya

Estimasi-Pose-Head-Head: Kerangka Tensorflow Lite untuk Wajah Mesh, Pose Kepala, Landmark, dan banyak lagi.
HeadposeSttimate: Sistem estimasi pose kepala berdasarkan landmark wajah 3D.
IMG2POSE: Pinjam implementasi renderer SIM3DR dalam repo ini.

Kutipan

Jika pekerjaan atau penelitian Anda mendapat manfaat dari repo ini, silakan kutip dua oto di bawah ini :) dan? repo ini.

 @inproceedings{guo2020towards,
    title =        {Towards Fast, Accurate and Stable 3D Dense Face Alignment},
    author =       {Guo, Jianzhu and Zhu, Xiangyu and Yang, Yang and Yang, Fan and Lei, Zhen and Li, Stan Z},
    booktitle =    {Proceedings of the European Conference on Computer Vision (ECCV)},
    year =         {2020}
}

@misc{3ddfa_cleardusk,
    author =       {Guo, Jianzhu and Zhu, Xiangyu and Lei, Zhen},
    title =        {3DDFA},
    howpublished = {url{https://github.com/cleardusk/3DDFA}},
    year =         {2018}
}

Kontak

Jianzhu Guo (郭建珠) [Beranda, Google Cendekia]: [email protected] atau [email protected] atau [email protected] (email ini akan segera tidak valid).

Memperluas

Informasi Tambahan

Versi v0.12 Release Notes
Tipe ular piton
Waktu Pembaruan 2025-07-12
ukuran 74.29MB
Berasal dari Github

Aplikasi Terkait

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Mesin analisis data Lihua versi gratis 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28
jsdoc_toolkit v2.3.1

2022-05-31

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ToDo Co

ular piton

1.0.0
Python Portfolio

ular piton
Alat bagan data sumber terbuka Redash v24.10.0

ular piton

24.10.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua