Unduh siamese triplet - Unduh Kode Sumber siamese triplet

siamese triplet

ular piton

1.0.0

Unduh

Pembelajaran Siam dan Triplet dengan Penambangan Pasangan/Triplet Online

Implementasi Pytorch dari jaringan Siam dan triplet untuk belajar embeddings.

Jaringan Siam dan Triplet berguna untuk mempelajari pemetaan dari gambar ke ruang Euclidean yang ringkas di mana jarak sesuai dengan ukuran kesamaan [2]. Embeddings yang dilatih dengan cara seperti itu dapat digunakan sebagai fitur vektor untuk klasifikasi atau tugas pembelajaran beberapa tembakan.

Instalasi

Membutuhkan Pytorch 0.4 dengan TorchVision 0.2.1

Untuk pytorch 0.3 Kompatibilitas Checkout Tag Torch-0.3.1

Struktur kode

datasets.py
- Kelas Siamesemnist - Pembungkus untuk set data seperti Mnist, mengembalikan pasangan positif dan negatif acak
- Kelas TripletMnist - Pembungkus untuk Dataset Seperti Mnist, Mengembalikan Triplet Random (Anchor, Positif dan Negatif)
- BalancedBatchSampler Class - BatchSampler untuk Loader Data, secara acak memilih N_Classes dan N_Samples dari setiap kelas berdasarkan label
networks.py
- Embeddingnet - jaringan dasar untuk mengkode gambar ke dalam vektor embedding
- CLASSIFIKASINET - Pembungkus untuk jaringan embedding, menambahkan lapisan yang sepenuhnya terhubung dan log softmax untuk klasifikasi
- Siamesenet - Pembungkus untuk jaringan penyematan, memproses pasangan input
- Tripletnet - Pembungkus untuk jaringan penyematan, memproses triplet input
kerugian.py
- Kontrasiveloss - Kehilangan kontras untuk pasangan embeddings dan target pasangan (sama/berbeda)
- Tripletloss - Kehilangan triplet untuk kembar tiga embeddings
- OnlinecontrastiveLoss - kerugian kontras untuk mini -batch embeddings. Menggunakan Objek Sipir untuk Menemukan Pasangan Positif dan Negatif dalam Batch Mini Menggunakan Label Kelas Kebenaran Tanah dan Menghitung Kehilangan Kontras untuk Pasangan Ini
- Onlinetripletloss - Kehilangan triplet untuk mini -batch embeddings. Menggunakan objek tripletselector untuk menemukan kembar tiga dalam mini-batch menggunakan label kelas kebenaran ground dan menghitung kehilangan triplet
trainer.py
- Fit - Fungsi Terpadu untuk melatih jaringan dengan jumlah input yang berbeda dan berbagai jenis fungsi kerugian
metrics.py
- Contoh metrik yang dapat digunakan dengan fungsi kesesuaian dari trainer.py
utils.py
- Sasselector - Abstrak Kelas Menentukan Objek Menghasilkan Pasangan Berdasarkan Label Embeddings dan Ground Truth Kelas. Dapat digunakan dengan Onlinecontrastiveloss .
  - AllPositivePairSelector, HardnegativePairSelector - Implementasi Pangkas
- TripletSelector - Abstrak Kelas Menentukan Objek Menghasilkan Triplet Berdasarkan Label Embeddings dan Ground Truth Class. Dapat digunakan dengan onlinetripletloss .
  - Alltripletselector , Hardestnegativetripletelector , RandomNegativetripletelector , Semihardnegativetripletelector - Implementasi TripletSelector

Contoh - Mnist

Kami akan melatih embeddings pada dataset MNIST. Eksperimen dijalankan di Jupyter Notebook.

Kami akan melalui pembelajaran embeddings fitur yang diawasi menggunakan berbagai fungsi kerugian pada dataset MNIST. Ini hanya untuk tujuan visualisasi, jadi kami akan menggunakan embeddings 2-dimensi yang bukan pilihan terbaik dalam praktiknya.

Untuk setiap percobaan, jaringan embedding yang sama digunakan (32 CONV 5x5 -> prelu -> maxpool 2x2 -> 64 CONV 5x5 -> prelu -> maxpool 2x2 -> padat 256 -> prelu -> padat 256 -> prelu -> padat 2) dan kami tidak melakukan pencarian hiperparameter apa pun.

Baseline - Klasifikasi dengan softmax

Kami menambahkan lapisan yang terhubung sepenuhnya dengan jumlah kelas dan melatih jaringan untuk klasifikasi dengan softmax dan cross-entropy. Jaringan berlatih ~ 99% akurasi. Kami mengekstrak 2 dimensi embedding dari lapisan kedua dari belakang:

Set kereta:

Set Tes:

Sementara embeddings terlihat terpisah (yang kami latih untuk mereka), mereka tidak memiliki sifat metrik yang baik. Mereka mungkin bukan pilihan terbaik sebagai deskriptor untuk kelas baru.

Jaringan Siam

Sekarang kita akan melatih jaringan Siam yang mengambil sepasang gambar dan melatih embeddings sehingga jarak di antara mereka diminimalkan jika mereka dari kelas yang sama dan lebih besar dari nilai margin jika mereka mewakili kelas yang berbeda. Kami akan meminimalkan fungsi kerugian kontras [1]:

Sampel kelas Siamesemnist acak pasangan positif dan negatif yang kemudian diumpankan ke jaringan Siam.

Setelah 20 zaman pelatihan di sini adalah embeddings yang kami dapatkan untuk pelatihan set:

Set Tes:

Embeddings yang dipelajari dikelompokkan jauh lebih baik di dalam kelas.

Jaringan kembar tiga

Kami akan melatih jaringan triplet, yang mengambil jangkar, contoh positif (dari kelas yang sama dengan jangkar) dan negatif (dari kelas yang berbeda dari jangkar). Tujuannya adalah untuk mempelajari embedding sehingga jangkar lebih dekat dengan contoh positif daripada contoh negatif dengan nilai margin.

alt text Sumber: Schroff, Florian, Dmitry Kalenichenko, dan James Philbin. FACENET: Embedding terpadu untuk pengenalan wajah dan pengelompokan. CVPR 2015.

Kehilangan triplet :

Kelas tripletmnist sampel contoh positif dan negatif untuk setiap jangkar yang mungkin.

Setelah 20 zaman pelatihan di sini adalah embeddings yang kami dapatkan untuk pelatihan set:

Set Tes:

Embeddings yang terpelajar tidak sedekat satu sama lain di dalam kelas seperti dalam kasus jaringan Siam, tetapi bukan itu yang kami optimalkan. Kami ingin embeddings lebih dekat dengan embeddings lain dari kelas yang sama daripada dari kelas lain dan kami dapat melihat di situlah pelatihan akan pergi.

Seleksi pasangan/triplet online - penambangan negatif

Ada beberapa masalah dengan jaringan Siam dan triplet:

Jumlah pasangan/kembar tiga yang mungkin tumbuh secara kuadratik/secara kubik dengan jumlah contoh. Tidak mungkin memproses semuanya dan pelatihan bertemu secara perlahan.
Kami menghasilkan pasangan/kembar tiga secara acak . Ketika pelatihan berlanjut, semakin banyak pasangan/kembar tiga mudah ditangani (nilai kerugian mereka sangat kecil atau bahkan 0), mencegah jaringan dari pelatihan . Kita perlu memberikan contoh -contoh sulit bagi jaringan.
Setiap gambar yang diumpankan ke jaringan hanya digunakan untuk perhitungan kehilangan kontras/triplet hanya untuk satu pasang/triplet. Perhitungan agak terbuang; Setelah embedding dihitung, itu bisa digunakan kembali untuk banyak pasangan/kembar tiga.

Untuk menangani masalah ini secara efisien, kami akan memberi makan jaringan dengan mini-batch standar seperti yang kami lakukan untuk klasifikasi. Fungsi kerugian akan bertanggung jawab untuk pemilihan pasangan keras dan kembar tiga dalam mini-batch. Jika kami memberi makan jaringan dengan 16 gambar per 10 kelas, kami dapat memproses hingga 159*160/2 = 12720 pasang dan 10*16*15/2*(9*16) = 172800 triplet, dibandingkan dengan 80 pasangan dan 53 kembar tiga dalam implementasi sebelumnya.

Biasanya itu bukan ide terbaik untuk memproses semua pasangan atau kembar tiga yang mungkin dalam mini-batch. Kita dapat menemukan beberapa strategi tentang cara memilih kembar tiga di [2] dan [3].

Pilihan pasangan online

Kami akan memberi makan jaringan dengan mini-batch, seperti yang kami lakukan untuk jaringan klasifikasi. Kali ini kami akan menggunakan BatchSampler khusus yang akan mencicipi N_Classes dan N_Samples di dalam setiap kelas, menghasilkan batch mini ukuran N_Classes*n_samples .

Untuk setiap pasangan mini Batch positif dan negatif akan dipilih menggunakan label yang disediakan.

MNIST adalah dataset yang agak mudah dan embeddings dari pasangan yang dipilih secara acak sudah cukup bagus, kami tidak melihat banyak peningkatan di sini.

Embeddings kereta:

Tes Embeddings:

Pilihan kembar tiga online

Kami akan memberi makan jaringan dengan mini-batch seperti dengan pilihan pasangan online. Ada beberapa strategi yang dapat kita gunakan untuk pemilihan triplet yang diberikan label dan prediksi embeddings:

Semua kemungkinan kembar tiga (mungkin terlalu banyak)
Negatif tersulit untuk setiap pasangan positif (akan menghasilkan negatif yang sama untuk setiap jangkar)
Negatif keras acak untuk setiap pasangan positif (pertimbangkan hanya kembar tiga dengan nilai kerugian triplet positif)
Negatif semi-keras untuk setiap pasangan positif (mirip dengan [2])

Strategi untuk pemilihan triplet harus dipilih dengan cermat. Strategi yang buruk dapat menyebabkan pelatihan yang tidak efisien atau, lebih buruk lagi, untuk memodelkan runtuh (semua embeddings berakhir memiliki nilai yang sama).

Inilah yang kami dapatkan dengan negatif keras acak untuk setiap pasangan positif.

Set Pelatihan:

Set Tes:

FashionMnist

Eksperimen serupa dilakukan untuk dataset FashionMnist di mana keunggulan penambangan negatif online sedikit lebih terlihat. Arsitektur jaringan yang sama persis dengan hanya embeddings 2 dimensi yang digunakan, yang mungkin tidak cukup kompleks untuk mempelajari embeddings yang baik. Dataset yang lebih kompleks dengan kelas angka yang lebih tinggi harus mendapat manfaat lebih dari penambangan online.

Baseline - Klasifikasi

Siamese vs kerugian kontras online dengan penambangan negatif

Jaringan siam dengan pasangan yang dipilih secara acak

Kerugian kontras online dengan penambangan negatif

Triplet vs Kehilangan Triplet Online dengan Penambangan Negatif

Jaringan kembar tiga dengan kembar tiga acak

Kehilangan triplet online dengan penambangan negatif

Todo

Optimalkan pemilihan triplet
Mengevaluasi dengan metrik yang sebanding antara pendekatan
Evaluasi dalam pengaturan satu-shot saat kelas dari set tes tidak dalam set kereta api
Tampilkan contoh pilihan triplet online pada dataset yang lebih sulit

Referensi

[1] Raia Hadsell, Sumit Chopra, Yann Lecun, Pengurangan Dimensi Dengan Mempelajari Pemetaan Invarian, CVPR 2006

[2] Schroff, Florian, Dmitry Kalenichenko, dan James Philbin. FACENET: Embedding terpadu untuk pengenalan wajah dan pengelompokan. CVPR 2015

[3] Alexander Hermans, Lucas Beyer, Bastian Leibe, membela kerugian triplet untuk identifikasi ulang orang, 2017

[4] Brandon Amos, Bartosz Ludwiczuk, Mahadev Satyanarayanan, OpenFace: Perpustakaan Pengenalan Wajah General-Purpose dengan Aplikasi Seluler, 2016

[5] Yi Sun, Xiaogang Wang, Xiaoou Tang, Representasi wajah pembelajaran yang mendalam dengan verifikasi identifikasi bersama, NIPS 2014

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe ular piton
Waktu Pembaruan 2025-07-11
ukuran 4.04MB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ToDo Co

ular piton

1.0.0
Python Portfolio

ular piton
Alat bagan data sumber terbuka Redash v24.10.0

ular piton

24.10.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua