Unduh image_search - Unduh Kode Sumber image

image_search

Kode sumber lainnya

1.0.0

Unduh

Aplikasi Pencarian Gambar

Intro Proyek

Munculnya Internet merevolusi cara kami mengakses informasi melalui mesin pencari yang kuat seperti Google, Bing, dan Yandex. Dengan hanya beberapa kata kunci, kami dapat dengan cepat menemukan halaman web yang berkaitan dengan pertanyaan kami. Sebagai teknologi, khususnya AI, kemajuan, banyak mesin pencari sekarang memfasilitasi pencarian gambar online.

Berbagai teknik untuk pencarian gambar telah muncul, termasuk:

Pencarian gambar dengan metadata: Di sini, pencarian tidak didasarkan pada gambar itu sendiri melainkan pada metadata mengikuti gambar seperti (kata kunci, teks, nama file, tanggal dll.)
Pencarian Gambar Berdasarkan Konten Gambar: Pendekatan ini menggunakan, teknik penglihatan komputer yang canggih untuk mengekstrak bentuk, warna, fitur apa pun yang relevan dari suatu gambar. Ini adalah teknik yang akan kami gunakan.

Dalam proyek ini, kami akan menggunakan jaringan saraf konvolusional pra-terlatih (CNN) untuk mengekstrak fitur berharga dari gambar. Metodologi ini, komponen kunci dari pencarian gambar berbasis konten, memberikan manfaat berikut:

CNN kuat: CNN telah terbukti sangat kuat untuk mengekstrak fitur -fitur utama dari suatu gambar.
CNN dapat mengurangi dimensi: Output CNN biasanya mewakili representasi gambar yang relevan dan relevan yang sering disebut peta fitur atau embedding atau vektor , karena tidak setiap piksel memiliki informasi yang signifikan. Representasi kental ini sering memiliki dimensi yang lebih kecil.

Singkatnya, dalam penelitian ini kami ingin menjawab pertanyaan berikut: Apakah dua gambar serupa terkait embedding masih serupa?

Teknologi / kerangka kerja yang digunakan

Deskripsi proyek

Untuk proyek ini, kami telah menggunakan CIFAR-10. Ini adalah dataset yang tersedia secara bebas yang terdiri dari 60.000 gambar warna, masing -masing mengukur 32x32 piksel . Gambar -gambar ini milik 10 kategori berbeda: pesawat terbang, mobil, burung, kucing, rusa, anjing, katak, kuda, kapal, dan truk. Untuk mendapatkan embedding yang sesuai, kami menerapkan model CNN yang sudah terlatih, khususnya VGG-16 , untuk mengekstraksi fitur-fitur penting. Vektor yang dihasilkan adalah 512 dimensi . Di dalam Pinecone, kami membuat indeks bernama "gambar" dengan dimensi 512, di mana semua vektor ini akan disimpan.

Gagasan di balik proyek ini adalah untuk menemukan apakah gambar burung yang serupa misalnya memiliki embedding yang serupa. Untuk melakukannya, kami telah mengunggah 50.000 dari total 60.000 gambar yang terkait dengan indeks Pinecone. Partisi ini dibuat untuk memastikan bahwa kami memiliki gambar yang sepenuhnya baru dan berbeda dibandingkan dengan yang sudah disimpan sebagai vektor di pinus. Perhatikan juga bahwa parisi ini sudah dilakukan oleh dataset CIFAR-10 ke dalam kereta dan uji batch yang mewakili versi serial dari array gambar asli.

Prinsip kerja

Picutre di bawah ini menggambarkan seluruh proses menyimpan embeddings ke indeks pinus. Dari langkah pertama membaca gambar, menerapkan jaringan saraf VGG16 pra-terlatih untuk menghasilkan embbed 512 dimensi yang kemudian ditingkatkan (yaitu disimpan) dalam indeks pinecone. prinsip

Waktu berjalan

Dalam proyek ini, kami menangani 50 ribu gambar, yang menimbulkan beberapa tantangan dalam hal kompusi terutama ketika membaca gambar, Unpickle (kami telah menurunkan versi serial dataset CIFAR-10) mereka dan mengekstraksi fitur melalui CNN. Kami mencoba memanfaatkan kekuatan komputasi parrallel saat menjalankan kode kami sehingga semuanya berjalan secepat mungkin pada beberapa core CPU melalui multithreading.
Catatan: Jika memungkinkan, jalankan proyek ini pada lingkungan bertenaga GPU untuk perhitungan yang lebih cepat.

Memulai

Buat akun Pinecone secara gratis di sini.
Dapatkan kunci API dan lingkungan yang terkait dengan akun Pinecone Anda
Klone repo ini (untuk bantuan lihat tutorial ini).
Buat lingkungan virtual di folder proyek (untuk bantuan lihat tutorial ini).
Jalankan perintah berikut untuk menginstal paket yang diperlukan.

Untuk pengguna Linux:

 pip3 install -r requirements.txt

Untuk pengguna Windows:

 pip install -r requirements.txt

Luncurkan skrip penyisipan gambar menggunakan yang berikut.

 python insert_data.py -key <API_KEY>  -env <ENV>  -metric <METRIC>

Ganti <vidt> dan <Api_key> dengan nilai yang Anda dapatkan dari akun Pinecone Anda. Tunggu skrip dilakukan. 7. Luncurkan aplikasi menggunakan yang berikut.

 streamlit run app.py -- -key <API_KEY> -env <ENV>

Setelah semuanya selesai, Anda harus melihat sesuatu seperti ini:

Halaman Beranda

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-05-31
ukuran 162.7MB
Berasal dari Github

Aplikasi Terkait

Bulk Image Downloader

2024-11-10
Pencarian Kata 800

2024-11-08
pytorch image models

2024-11-03
galeri gambar moa

2011-09-14
Tuan rumah gambar CF

2011-04-26
ajax-pengunggah-gambar

2010-09-29

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua