talking head anime 2 demo

talking head anime 2 demo

Kode sumber lainnya

1.0.0

Unduh

Kode demo untuk "Talking Head Anime dari satu gambar 2: lebih ekspresif"

Repositori ini berisi program demo untuk anime kepala berbicara dari satu gambar 2: proyek yang lebih ekspresif. Mirip dengan versi sebelumnya, ia memiliki dua program:

manual_poser memungkinkan Anda memanipulasi ekspresi wajah dan rotasi kepala karakter anime, yang diberikan dalam satu gambar, melalui antarmuka pengguna grafis. Poser tersedia dalam dua formulir: aplikasi GUI standar, dan buku catatan Jupyter.
ifacialmocap_puppeteer memungkinkan Anda mentransfer gerakan wajah Anda, yang ditangkap oleh aplikasi iOS komersial yang disebut IfacialMocap, ke gambar karakter anime.

Coba Poser Manual di Google Colab

Jika Anda tidak memiliki perangkat keras yang diperlukan (dibahas di bawah) atau tidak ingin mengunduh kode dan mengatur lingkungan untuk menjalankannya, klik untuk mencoba menjalankan poser manual di Google Colab.

Persyaratan perangkat keras

Kedua program membutuhkan GPU NVIDIA baru -baru ini dan kuat untuk dijalankan. Saya secara pribadi bisa menjalankannya dengan kecepatan tinggi dengan Nvidia Titan RTX. Namun, saya pikir GPU game kelas atas baru-baru ini seperti RTX 2080, RTX 3080, atau lebih baik juga akan melakukannya.

ifacialmocap_puppeteer membutuhkan perangkat iOS yang mampu menghitung parameter bentuk campuran dari umpan video. Ini berarti bahwa perangkat harus dapat menjalankan iOS 11.0 atau lebih tinggi dan harus memiliki kamera yang menghadap ke depan truedepth. (Lihat halaman ini untuk info lebih lanjut.) Dengan kata lain, jika Anda memiliki iPhone X atau sesuatu yang lebih baik, Anda harus siap. Secara pribadi, saya telah menggunakan iPhone 12 mini.

Persyaratan perangkat lunak

Kedua program ditulis dalam Python 3. Untuk menjalankan GUI, paket perangkat lunak berikut diperlukan:

Python> = 3.8
Pytorch> = 1.7.1 dengan dukungan CUDA
SCIPY> = 1.6.0
wxpython> = 4.1.1
Matplotlib> = 3.3.4

Secara khusus, saya menciptakan lingkungan untuk menjalankan program dengan Anaconda, menggunakan perintah berikut:

 > conda create -n talking-head-anime-2-demo python=3.8
> conda activate talking-head-anime-2-demo
> conda install pytorch torchvision cudatoolkit=10.2 -c pytorch
> conda install scipy
> pip install wxPython
> conda install matplotlib

Catatan: Anda mungkin menemukan bahwa versi khusus Python (3.8) dan CUDA Toolkit (10.2) mungkin tidak berfungsi untuk pengaturan komputer khusus Anda. Ketika ini terjadi, ganti versi ini dengan yang berfungsi dengan perangkat keras Anda. Perintah itu akan menjadi:

 > conda create -n talking-head-anime-2-demo python=[YOUR-PYTHON-VERSION]
> conda activate talking-head-anime-2-demo
> conda install pytorch torchvision cudatoolkit=[YOUR-CUDA-TOOLKIT-VERSION] -c pytorch
> conda install scipy
> pip install wxPython
> conda install matplotlib

Secara umum, versi terbaru Python dan versi terbaru dari CUDA Toolkit yang ditampilkan di situs web Pytorch akan berfungsi.

Untuk menjalankan versi notebook Jupyter dari manual_poser , Anda juga perlu:

Jupyter Notebook> = 6.2.0
Ipywidgets> = 7.6.3

Ini berarti bahwa, selain perintah di atas, Anda juga perlu menjalankan:

 > conda install -c conda-forge notebook
> conda install -c conda-forge ipywidgets
> jupyter nbextension enable --py widgetsnbextension

Terakhir, ifacialmocap_puppeteer memerlukan ifacialmocap, yang tersedia di toko aplikasi untuk 980 yen. Anda juga perlu menginstal aplikasi desktop berpasangan di PC atau Mac Anda. (Pengguna Linux, maaf!) IOS Anda dan komputer Anda juga harus menggunakan jaringan yang sama. (Misalnya, Anda dapat menghubungkannya ke router nirkabel yang sama.)

Konstruksi Lingkungan Otomatis dengan Anaconda

Anda juga dapat menggunakan Anaconda untuk mengunduh dan menginstal semua paket Python dalam satu perintah. Buka shell Anda, ubah direktori ke tempat Anda mengkloning repositori, dan jalankan:

 conda env create -f environment.yml

Ini akan menciptakan lingkungan yang disebut talking-head-anime-2-demo yang berisi semua paket Python yang diperlukan.

Unduh modelnya

Sebelum menjalankan program, Anda perlu mengunduh file model dari tautan dropbox ini dan membuka ritsleting ke folder data direktori repositori. Pada akhirnya, folder data harus terlihat seperti:

 + data
  + illust
    - waifu_00.png
    - waifu_01.png
    - waifu_02.png
    - waifu_03.png
    - waifu_04.png
    - waifu_05.png
    - waifu_06.png
    - waifu_06_buggy.png
  - combiner.pt
  - eyebrow_decomposer.pt
  - eyebrow_morphing_combiner.pt
  - face_morpher.pt
  - two_algo_face_rotator.pt

File model didistribusikan dengan Lisensi Internasional Creative Commons Attribution 4.0, yang berarti Anda dapat menggunakannya untuk tujuan komersial. Namun, jika Anda mendistribusikannya, Anda harus, antara lain, mengatakan bahwa saya adalah pencipta.

Menjalankan Aplikasi Desktop `manual_poser`

Buka shell. Ubah direktori kerja Anda ke direktori root repositori. Lalu, jalankan:

 > python tha2/app/manual_poser.py

Perhatikan bahwa sebelum menjalankan perintah di atas, Anda mungkin harus mengaktifkan lingkungan Python yang berisi paket yang diperlukan. Jika Anda menciptakan lingkungan menggunakan Anaconda seperti yang dibahas di atas, Anda harus berlari

 > conda activate talking-head-anime-2-demo

Jika Anda belum mengaktifkan lingkungan.

Menjalankan `manual_poser` jupyter notebook

Buka shell. Aktifkan lingkungan. Ubah direktori kerja Anda ke direktori root repositori. Lalu, jalankan:

 > jupyter notebook

Jendela browser harus terbuka. Di dalamnya, buka tha2.ipynb . Setelah Anda melakukannya, Anda harus melihat bahwa ia hanya memiliki satu sel. Jalankan. Kemudian, gulir ke bawah ke akhir dokumen, dan Anda akan melihat GUI di sana.

Menjalankan `ifacialmocap_puppeteer`

Pertama, jalankan IfacialMoCap di perangkat iOS Anda. Ini harus menunjukkan alamat IP perangkat Anda. Mencatatnya. Buka aplikasi.

IP address in iFacialMocap screen

Kemudian, jalankan aplikasi desktop pendamping.

iFaciaMocap desktop application

Klik "Buka Pengaturan Tingkat Lanjut >>". Aplikasi harus diperluas.

Click the 'Open Advanced Setting >>' button.

Klik tombol yang bertuliskan "Maya" di sisi kanan.

Click the 'Maya' button.

Kemudian, klik "Blender."

Select 'Blender' mode in the desktop application

Selanjutnya, ganti alamat IP di sisi kiri dengan alamat IP perangkat iOS Anda.

Replace IP address with device's IP address.

Klik "Hubungkan ke Blender."

Click 'Connect to Blender.'

Buka shell. Aktifkan lingkungan. Ubah direktori kerja Anda ke direktori root repositori. Lalu, jalankan:

 > python tha2/app/ifacialmocap_puppeteer.py

Jika program terhubung dengan benar, Anda harus melihat bahwa banyak bilah kemajuan di bagian bawah jendela ifacialmocap_puppeteer harus bergerak ketika Anda menggerakkan wajah Anda di depan kamera yang menghadap ke depan perangkat iOS.

You should see the progress bars moving.

Jika semuanya baik -baik saja, muat gambar karakter, dan itu harus mengikuti gerakan wajah Anda.

Kendala pada gambar input

Agar model berfungsi dengan baik, gambar input harus mematuhi kendala berikut:

Itu harus memiliki saluran alfa.
Itu harus hanya mengandung satu karakter anime humanoid.
Karakter harus melihat lurus ke depan.
Kepala karakter harus secara kasar terkandung di kotak tengah 128 x 128.
Semua piksel yang bukan milik karakter (yaitu, piksel latar belakang) harus memiliki saluran alfa (a) menjadi 0.

Perhatikan, bagaimanapun, bahwa terlepas dari ukuran gambar input, program akan selalu mengubah ukurannya menjadi 256x256 dan akan selalu menghasilkan gambar 256x256. Ini adalah batasan intrinsik dari sistem.

Image specification

Kutipan

Jika pekerjaan akademis Anda mendapat manfaat dari kode di repositori ini, silakan kutip halaman web proyek sebagai berikut:

Pramook Khungurn. Bicara anime kepala dari satu gambar 2: lebih ekspresif. http://pkhungurn.github.io/talking-head-anime-2/, 2021. Diakses: yyyy-mm-dd.

Anda juga dapat menggunakan entri Bibtex berikut:

 @misc{Khungurn:2021,
    author = {Pramook Khungurn},
    title = {Talking Head Anime from a Single Image 2: More Expressive},
    howpublished = {url{http://pkhungurn.github.io/talking-head-anime-2/}},
    year = 2021,
    note = {Accessed: YYYY-MM-DD},
}

Penafian

Meskipun penulisnya adalah karyawan Google Japan, perangkat lunak ini bukan produk Google dan tidak didukung oleh Google.

Hak cipta perangkat lunak ini adalah milik saya karena saya telah memintanya menggunakan proses IARC. Namun, Google mungkin mengklaim hak atas kekayaan intelektual dari penemuan ini.

Kode ini dirilis di bawah lisensi MIT. Model ini dirilis di bawah Lisensi Internasional Creative Commons Attribution 4.0.

Memperluas

Informasi Tambahan