Ini adalah implementasi referensi efek 3D Ken Burns dari satu gambar [1] menggunakan pytorch. Diberikan gambar input tunggal, ini menjiwai gambar diam ini dengan pemindaian kamera virtual dan zoom dengan gerak paralaks. Jika Anda memanfaatkan pekerjaan kami, silakan kutip kertas kami [1].
Beberapa fungsi diimplementasikan di CUDA menggunakan Cupy, itulah sebabnya Cupy adalah ketergantungan yang diperlukan. Ini dapat diinstal menggunakan pip install cupy atau sebagai alternatif menggunakan salah satu paket biner yang disediakan sebagaimana diuraikan dalam repositori cupy. Harap juga pastikan variabel lingkungan CUDA_HOME dikonfigurasi.
Untuk menghasilkan hasil video, harap juga pastikan agar pip install moviepy diinstal.
Untuk menjalankannya pada gambar dan menghasilkan efek 3D Ken Burns sepenuhnya secara otomatis, gunakan perintah berikut.
python autozoom.py --in ./images/doublestrike.jpg --out ./autozoom.mp4
Untuk memulai antarmuka yang memungkinkan Anda untuk menyesuaikan jalur kamera secara manual, gunakan perintah berikut. Anda kemudian dapat menavigasi ke http://localhost:8080/ dan memuat gambar menggunakan tombol di sudut kanan bawah. Harap bersabar saat memuat gambar dan menyimpan hasilnya, ada sedikit pemrosesan latar belakang yang terjadi.
python interface.py
Untuk menjalankan estimasi kedalaman untuk mendapatkan estimasi kedalaman mentah, gunakan perintah berikut. Harap dicatat bahwa skrip ini tidak melakukan penyesuaian kedalaman, lihat #22 untuk informasi tentang cara menambahkannya.
python depthestim.py --in ./images/doublestrike.jpg --out ./depthestim.npy
Untuk membandingkan estimasi kedalaman, jalankan python benchmark-ibims.py atau python benchmark-nyu.py . Anda dapat menggunakannya untuk dengan mudah memverifikasi bahwa implementasi yang disediakan berjalan seperti yang diharapkan.
Jika Anda tidak memiliki lingkungan yang cocok untuk menjalankan proyek ini maka Anda bisa mencoba Colab. Ini memungkinkan Anda untuk menjalankan proyek di cloud, gratis. Ada beberapa orang yang menyediakan notebook colab yang seharusnya membuat Anda memulai. Beberapa yang saya ketahui termasuk satu dari Arnaldo Gabriel, satu dari Vlad Alex, dan satu dari Ahmed Harmouche.
Dataset ini dilisensikan di bawah Lisensi Publik Internasional Creative Commons Attribution-NonCommercial-Sharealike 4.0 (CC BY-SA 4.0) dan hanya dapat digunakan untuk tujuan non-komersial. Silakan lihat file lisensi untuk informasi lebih lanjut.
| pemandangan | mode | warna | kedalaman | normal |
|---|---|---|---|---|
| asdf | penerbangan | 3,7 GB | 1,0 GB | 2,9 GB |
| asdf | sedang berjalan | 3,6 GB | 0,9 GB | 2,7 GB |
| kosong | penerbangan | 3.2 GB | 1,0 GB | 2,8 GB |
| kosong | sedang berjalan | 3.0 GB | 0,9 GB | 2,7 GB |
| santai | penerbangan | 5.4 GB | 1.1 GB | 10.8 GB |
| santai | sedang berjalan | 5.2 GB | 1,0 GB | 10,5 GB |
| kota | penerbangan | 0,8 GB | 0,2 GB | 0,9 GB |
| kota | sedang berjalan | 0,7 GB | 0,2 GB | 0,8 GB |
| lingkungan | penerbangan | 1,9 GB | 0,5 GB | 3,5 GB |
| lingkungan | sedang berjalan | 1,8 GB | 0,5 GB | 3.3 GB |
| benteng | penerbangan | 5.0 GB | 1.1 GB | 9.2 GB |
| benteng | sedang berjalan | 4,9 GB | 1.1 GB | 9.3 GB |
| rumput | penerbangan | 1.1 GB | 0,2 GB | 1,9 GB |
| rumput | sedang berjalan | 1.1 GB | 0,2 GB | 1,6 GB |
| es | penerbangan | 1.2 GB | 0,2 GB | 2.1 GB |
| es | sedang berjalan | 1.2 GB | 0,2 GB | 2.0 GB |
| Ksatria | penerbangan | 0,8 GB | 0,2 GB | 1,0 GB |
| Ksatria | sedang berjalan | 0,8 GB | 0,2 GB | 0,9 GB |
| pos terdepan | penerbangan | 4,8 GB | 1.1 GB | 7,9 GB |
| pos terdepan | sedang berjalan | 4,6 GB | 1,0 GB | 7.4 GB |
| Bajak laut | penerbangan | 0,8 GB | 0,2 GB | 0,8 GB |
| Bajak laut | sedang berjalan | 0,7 GB | 0,2 GB | 0,8 GB |
| penembak | penerbangan | 0,9 GB | 0,2 GB | 1.1 GB |
| penembak | sedang berjalan | 0,9 GB | 0,2 GB | 1,0 GB |
| toko | penerbangan | 0,2 GB | 0,1 GB | 0,2 GB |
| toko | sedang berjalan | 0,2 GB | 0,1 GB | 0,2 GB |
| daerah kumuh | penerbangan | 0,5 GB | 0,1 GB | 0,8 GB |
| daerah kumuh | sedang berjalan | 0,5 GB | 0,1 GB | 0,7 GB |
| Subway | penerbangan | 0,5 GB | 0,1 GB | 0,9 GB |
| Subway | sedang berjalan | 0,5 GB | 0,1 GB | 0,9 GB |
| kuil | penerbangan | 1,7 GB | 0,4 GB | 3.1 GB |
| kuil | sedang berjalan | 1,7 GB | 0,3 GB | 2,8 GB |
| Titan | penerbangan | 6.2 GB | 1.1 GB | 11,5 GB |
| Titan | sedang berjalan | 6.0 GB | 1.1 GB | 11.3 GB |
| kota | penerbangan | 1,7 GB | 0,3 GB | 3.0 GB |
| kota | sedang berjalan | 1,8 GB | 0,3 GB | 3.0 GB |
| Underland | penerbangan | 5.4 GB | 1.2 GB | 12.1 GB |
| Underland | sedang berjalan | 5.1 GB | 1.2 GB | 11.4 GB |
| Victoria | penerbangan | 0,5 GB | 0,1 GB | 0,8 GB |
| Victoria | sedang berjalan | 0,4 GB | 0,1 GB | 0,7 GB |
| desa | penerbangan | 1,6 GB | 0,3 GB | 2,8 GB |
| desa | sedang berjalan | 1,6 GB | 0,3 GB | 2,7 GB |
| gudang | penerbangan | 0,9 GB | 0,2 GB | 1,5 GB |
| gudang | sedang berjalan | 0,8 GB | 0,2 GB | 1.4 GB |
| barat | penerbangan | 0,8 GB | 0,2 GB | 0,9 GB |
| barat | sedang berjalan | 0,7 GB | 0,2 GB | 0,8 GB |
Harap dicatat bahwa ini adalah versi yang diperbarui dari dataset yang telah kami gunakan dalam makalah kami. Jadi sementara itu memiliki adegan lebih sedikit, setiap tangkapan sampel sekarang memiliki panjang fokus yang bervariasi yang seharusnya membantu dengan generalisasi. Selain itu, beberapa contoh terlalu banyak atau kurang terpapar dan itu akan menjadi ide yang baik untuk menghapus outlier ini. Silakan lihat #37, #39, dan #40 untuk diskusi tambahan.
Ini adalah proyek oleh Adobe Research. Ini dilisensikan di bawah Lisensi Publik Internasional Creative Commons Attribution-NonCommercial-Sharealike 4.0 International (CC BY-SA 4.0) dan hanya dapat digunakan untuk keperluan non-komersial. Silakan lihat file lisensi untuk informasi lebih lanjut.
[1] @article{Niklaus_TOG_2019,
author = {Simon Niklaus and Long Mai and Jimei Yang and Feng Liu},
title = {3D Ken Burns Effect from a Single Image},
journal = {ACM Transactions on Graphics},
volume = {38},
number = {6},
pages = {184:1--184:15},
year = {2019}
}
Video di atas menggunakan materi di bawah lisensi umum yang kreatif atau dengan izin pemilik, sebagaimana dirinci pada akhirnya.