Download MAX Image Resolution Enhancer - Unduh Kode Sumber MAX Image Resolution Enhancer

MAX Image Resolution Enhancer

Kode sumber lainnya

v1.1.0

Unduh

IBM Developer Model Asset Exchange: Penambah Resolusi Gambar

Repositori ini berisi kode untuk membuat instantiate dan menggunakan penambah resolusi gambar. Model ini mampu meningkatkan gambar pixelated dengan faktor 4, sambil menghasilkan detail foto-realistis.

GAN didasarkan pada repositori GitHub ini dan pada artikel penelitian ini.

Model ini dilatih pada 600.000 gambar dari dataset OpenImages V4, dan file model di -host pada penyimpanan objek cloud IBM. Kode dalam repositori ini menyebarkan model sebagai layanan web dalam wadah Docker. Repositori ini dikembangkan sebagai bagian dari pertukaran asset Model Pengembang IBM dan API publik ditenagai oleh IBM Cloud.

Model metadata

Domain	Aplikasi	Industri	Kerangka	Data pelatihan	Input Format Data
Penglihatan	Super-resolusi	Umum	Tensorflow	OpenImages v4	Gambar (RGB/HWC)

Benchmark

Set5	SRGAN Penulis	Ini srgan
Psnr	29.40	29.56
SSIM	0.85	0.85

Set14	SRGAN Penulis	Ini srgan
Psnr	26.02	26.25
SSIM	0.74	0.72

BSD100	SRGAN Penulis	Ini srgan
Psnr	25.16	24.4
SSIM	0.67	0.67

Kinerja implementasi ini dievaluasi pada tiga dataset: SET5, SET14, dan BSD100. Metrik PSNR (Rasio Puncak ke Noise) dan SSIM (Indeks Kesamaan Struktural) dievaluasi, meskipun makalah ini membahas MOS (skor opini rata -rata) sebagai metrik yang paling menguntungkan. Intinya, implementasi SRGAN memperdagangkan skor PSNR atau SSIM yang lebih baik untuk hasil yang lebih menarik bagi mata manusia. Ini mengarah ke kumpulan gambar output dengan detail yang lebih renyah dan realistis.

CATATAN: SRGAN di koran dilatih pada sampel Imagenet 350K, sedangkan SRGAN ini dilatih pada 600K OpenImages V4 Pictures.

Referensi

C. Ledig, L. Theis, F. Huszar, J. Caballero, A. Cunningham, A. Acosta, A. Aitken, A. Tejani, J. Totz, Z. Wang, W. Shi , Resolusi Super Gambar Tunggal Foto-Realistis menggunakan Jaringan Perpanjangan Generatif, Arxiv, 2017.
Srgan-TensorFlow (Sumber Kode Model)
Tensorflow-Srgan
Artefak dekonvolusi dan kotak -kotak

Lisensi

Komponen	Lisensi	Link
Repositori ini	Apache 2.0	LISENSI
Bobot model	Apache 2.0	LISENSI
Kode model (pihak ke -3)	Mit	LISENSI
Sampel uji	CC oleh 2.0	Aset readme
	CC0	Aset readme

Prasyarat:

docker : Antarmuka baris perintah Docker. Ikuti instruksi instalasi untuk sistem Anda.
Sumber daya minimum yang disarankan untuk model ini adalah memori 8 GB (lihat Pemecahan Masalah) dan 4 CPU.
Jika Anda berada di X86-64/AMD64, CPU Anda harus mendukung AVX setidaknya.

Opsi penempatan

Menyebarkan dari Quay
Menggunakan Red Hat Openshift
Menyebarkan Kubernetes
Jalankan secara lokal

Menyebarkan dari Quay

Untuk menjalankan gambar Docker, yang secara otomatis memulai model yang melayani API, jalankan:

 $ docker run -it -p 5000:5000 quay.io/codait/max-image-resolution-enhancer

Ini akan menarik gambar yang sudah dibangun dari registri wadah Quay.io (atau menggunakan gambar yang ada jika sudah di-cache secara lokal) dan jalankan. Jika Anda lebih suka checkout dan membangun model secara lokal, Anda dapat mengikuti langkah run secara lokal di bawah ini.

Menggunakan Red Hat Openshift

Anda dapat menggunakan microservice microservice yang melayani model pada Red Hat OpenShift dengan mengikuti instruksi untuk OpenShift Web Console atau OpenShift Container Platform CLI dalam tutorial ini, menentukan quay.io/codait/max-image-resolution-enhancer sebagai nama gambar.

Menyebarkan Kubernetes

Anda juga dapat menggunakan model pada Kubernetes menggunakan gambar Docker terbaru di Quay.

Di kluster Kubernetes Anda, jalankan perintah berikut:

 $ kubectl apply -f https://github.com/IBM/max-image-resolution-enhancer/raw/master/max-image-resolution-enhancer.yaml

Model ini akan tersedia secara internal di port 5000 , tetapi juga dapat diakses secara eksternal melalui NodePort .

Tutorial yang lebih rumit tentang cara menggunakan model maksimal ini ke produksi di IBM Cloud dapat ditemukan di sini.

Jalankan secara lokal

Bangun model
Menggunakan model
Gunakan model
Perkembangan
Pembersihan

1. Bangun model

Kloning repositori ini secara lokal. Di terminal, jalankan perintah berikut:

 $ git clone https://github.com/IBM/max-image-resolution-enhancer.git

Ubah direktori ke dalam folder dasar repositori:

 $ cd max-image-resolution-enhancer

Untuk membangun gambar Docker secara lokal, jalankan:

 $ docker build -t max-image-resolution-enhancer .

Semua aset model yang diperlukan akan diunduh selama proses pembangunan. Perhatikan bahwa saat ini gambar Docker ini hanya CPU (kami akan menambahkan dukungan untuk gambar GPU nanti).

2. Menyebarkan model

Untuk menjalankan gambar Docker, yang secara otomatis memulai model yang melayani API, jalankan:

 $ docker run -it -p 5000:5000 max-image-resolution-enhancer

3. Gunakan model

Server API secara otomatis menghasilkan halaman dokumentasi kesombongan interaktif. Pergi ke http://localhost:5000 untuk memuatnya. Dari sana Anda dapat menjelajahi API dan juga membuat permintaan tes.

Gunakan titik akhir model/predict untuk memuat gambar uji (Anda dapat menggunakan salah satu gambar uji dari samples/test_examples/low_resolution folder) untuk mendapatkan gambar output resolusi tinggi dikembalikan.

Gambar input yang ideal adalah file PNG dengan resolusi antara 100x100 dan 500x500, lebih disukai tanpa pemrosesan post-capture dan warna mencolok. Model ini dapat menghasilkan detail dari gambar pixelated (DPI rendah), tetapi tidak dapat memperbaiki gambar 'kabur'.

masukan Kiri: Gambar input (128 × 80). Kanan: Gambar Output (512 × 320)

Tangkapan layar UI Swagger

Anda juga dapat mengujinya pada baris perintah, misalnya:

 $ curl -F "image=@samples/test_examples/low_resolution/food.png" -XPOST http://localhost:5000/model/predict > food_high_res.png

Perintah di atas akan mengirim file food.png resolusi rendah ke model, dan menyimpan gambar output resolusi tinggi ke file food_high_res.png di direktori root.

4. Pengembangan

Untuk menjalankan aplikasi Flask API dalam mode debug, edit config.py untuk mengatur DEBUG = True di bawah pengaturan aplikasi. Anda kemudian perlu membangun kembali gambar Docker (lihat Langkah 1).

Harap ingat untuk mengatur DEBUG = False saat menjalankan model dalam produksi.

5. Pembersihan

Untuk menghentikan wadah Docker, ketik CTRL + C di terminal Anda.

Pemecahan masalah

Memanggil model/predict titik akhir membunuh wadah Docker dengan pesan Killed

Ini kemungkinan disebabkan karena batasan default alokasi memori Docker hingga 2 GB. Arahkan ke menu Preferences di bawah aplikasi Docker Desktop. Gunakan slider untuk meningkatkan memori yang tersedia menjadi 8 GB dan restart desktop Docker.

Detail dalam gambar output berbeda dari yang mungkin diharapkan dan terkadang tidak secara fisik memungkinkan

Model ini pada dasarnya menghasilkan detail 'dari udara tipis'. Membuat sesuatu dari tidak ada yang tidak mungkin terjadi tanpa membuat asumsi. Jaringan berusaha untuk mengenali elemen-elemen dalam gambar resolusi rendah dari mana ia dapat menyimpulkan seperti apa realitas (mata manusia | Super-Resolution). Jika sekelompok piksel sangat menyerupai pengamatan yang tidak terkait dengan konten gambar, itu mungkin mengarah pada mengamati hasil yang tidak 'secara fisik mungkin'.

Sebagai contoh: piksel putih dalam gambar resolusi rendah mungkin telah dikonversi menjadi kepingan salju, meskipun gambar aslinya mungkin telah diambil di padang pasir. Contoh ini adalah imajiner dan belum benar -benar diamati.

Artefak di gambar output

Mengamati artefak dalam beberapa gambar sayangnya tidak dapat dihindari karena jaringan saraf mana pun tunduk pada keterbatasan teknis dan karakteristik data pelatihan.

Perlu diingat bahwa hasil terbaik dicapai dengan yang berikut:
Gambar png
Gambar yang cukup diperbesar. Selama proses, jaringan mengelompokkan blok piksel bersama -sama. Jika blok berisi lebih banyak detail daripada yang dihasilkan jaringan, hasilnya akan palsu.
Gambar yang diambil di bawah cahaya alami, tanpa filter, dan dengan sedikit warna yang cerah atau mencolok. Jaringan saraf tidak dilatih pada gambar yang sangat diedit.
Gambar yang memiliki resolusi yang cukup tinggi untuk tidak membingungkan jaringan dengan beberapa kemungkinan (misalnya piksel tunggal dalam gambar resolusi yang sangat rendah dapat mewakili seluruh mobil, orang, sandwich, ..)
Model ini dapat menghasilkan detail dari gambar pixelated (DPI rendah), tetapi tidak dapat memperbaiki gambar 'kabur'.

Sumber Daya dan Kontribusi

Jika Anda tertarik untuk berkontribusi pada proyek Model Asset Exchange atau memiliki pertanyaan, silakan ikuti instruksi di sini.

Memperluas

Informasi Tambahan

Versi v1.1.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-02-27
ukuran 17.84MB
Berasal dari Github

Aplikasi Terkait

Bulk Image Downloader

2024-11-10
pytorch image models

2024-11-03
Peningkat Foto AI

2023-07-14
galeri gambar moa

2011-09-14
Tuan rumah gambar CF

2011-04-26
Tuan rumah gambar CF

2011-04-26

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0

Informasi Terkait Semua