Téléchargement siamese triplet - Téléchargement du code source siamese triplet

siamese triplet

Python

1.0.0

Télécharger

Apprentissage siamois et triplet avec une paire en ligne / Triplet Mining

Pytorch Implémentation de réseaux siamois et triplet pour l'apprentissage des intérêts.

Les réseaux siamois et triplet sont utiles pour apprendre les mappages de l'image à un espace euclidien compact où les distances correspondent à une mesure de la similitude [2]. Les intégres formés de cette manière peuvent être utilisés comme vecteurs de caractéristiques pour les tâches d'apprentissage de classification ou à quelques coups.

Installation

Nécessite Pytorch 0.4 avec TorchVision 0.2.1

Pour Pytorch 0.3 Compatibilité Céche à coche Torch-0.3.1

Structure de code

dataSets.py
- Classe SiameSemiste - Emballage pour un ensemble de données de type MNIST, renvoyant des paires positives et négatives aléatoires
- Classe TripletMnist - Emballage pour un ensemble de données de type MNIST, renvoyant des triplets aléatoires (ancre, positif et négatif)
- Classe BalancedBatchSampler - BatchSampler pour le chargeur de données, choisit au hasard n_classes et n_s échantillons de chaque classe en fonction des étiquettes
Networks.py
- EmbeddingNet - Réseau de base pour le codage des images dans un vecteur d'intégration
- ClassificationNet - Wrapper pour un réseau d'intégration, ajoute une couche et un journal entièrement connectés pour la classification
- Siamesenet - Wrapper pour un réseau d'intégration, traite des paires d'entrées
- TripletNet - Wrapper pour un réseau d'intégration, traite les triplets d'entrées
pertes.py
- Contrasteloss - perte contrastive pour les paires d'incorporation et la cible de la paire (même / différente)
- Tripletloss - Perte de triplet pour les triplés des intégres
- OnlineContrasiveloss - perte contrastive pour un mini-lots d'incorporation. Utilise un objet PairSelector pour trouver des paires positives et négatives dans un mini-lot en utilisant les étiquettes de classe de vérité au sol et calcule la perte contrastée pour ces paires
- OnlineTripletloss - Perte de triplet pour un mini-dossier d'incorporation. Utilise un objet tripletSelector pour trouver des triplets dans un mini-lot en utilisant les étiquettes de classe de vérité au sol et calculez la perte de triplet
Trainer.py
- FIT - Fonction unifiée pour la formation d'un réseau avec un nombre différent d'entrées et différents types de fonctions de perte
metrics.py
- Exemples de mesures qui peuvent être utilisées avec la fonction d'ajustement de Trainer.py
utils.py
- PAILSELLECTEOR - Résumé classe définissant des objets générant des paires basées sur des intégres et des étiquettes de classe de vérité au sol. Peut être utilisé avec onlineContrasheulloss .
  - AllPositivePairSelector, HardNegativePairselect
- TripletSelector - classe abstraite définissant des objets générant des triplets basés sur des intégres et des étiquettes de classe de vérité au sol. Peut être utilisé avec onlinetripletloss .
  - AlltripletSelector , durestnegativeTripletSelector , RandomNegativeTripleTelector , semihardnegativeTripleTelect

Exemples - MNIST

Nous allons entraîner des intégres sur un ensemble de données MNIST. Des expériences ont été exécutées dans Jupyter Notebook.

Nous allons passer par l'apprentissage des intérêts supervisés des fonctionnalités en utilisant différentes fonctions de perte sur l'ensemble de données MNIST. Ceci est juste à des fins de visualisation, nous utiliserons donc des intégres bidimensionnels qui n'est pas le meilleur choix en pratique.

Pour chaque expérience, le même réseau d'incorporation est utilisé (32 Conv 5x5 -> Prelu -> Maxpool 2x2 -> 64 Conv 5x5 -> Prelu -> Maxpool 2x2 -> dense 256 -> Prelu -> dense 256 -> Prelu -> Dense 2) et nous ne effectuons aucune recherche hyperparamètre.

Baseline - Classification avec softmax

Nous ajoutons une couche entièrement connectée avec le nombre de classes et formons le réseau pour la classification avec SoftMax et Cross-Entropy. Le réseau s'entraîne à une précision de ~ 99%. Nous extraissons des incorporations en 2 dimensions de l'avant-dernière couche:

Ensemble de train:

Ensemble de tests:

Bien que les intérêts semblent séparables (ce pour quoi nous les avons formés), ils n'ont pas de bonnes propriétés métriques. Ils pourraient ne pas être le meilleur choix en tant que descripteur pour les nouvelles classes.

Réseau siamois

Maintenant, nous allons entraîner un réseau siamois qui prend une paire d'images et entraîne les intérêts afin que la distance entre eux soit minimisée si elles sont de la même classe et sont supérieures à une valeur de marge si elles représentent des classes différentes. Nous allons minimiser une fonction de perte contrastive [1]:

La classe Siamesemiste échantillonne des paires positives et négatives aléatoires qui sont ensuite transmises au réseau siamois.

Après 20 époques de formation, voici les intérêts que nous obtenons pour un ensemble de formation:

Ensemble de tests:

Les incorporations apprises sont bien mieux regroupées en classe.

Réseau de triplet

Nous allons entraîner un réseau de triplet, qui prend une ancre, un exemple positif (de même classe qu'un ancre) et négatif (d'une classe différente d'une ancre). L'objectif est d'apprendre des intérêts de telle sorte que l'ancre est plus proche de l'exemple positif que de l'exemple négatif par une certaine valeur de marge.

alt text Source: Schroff, Florian, Dmitry Kalenichenko et James Philbin. Facenet: Une intégration unifiée pour la reconnaissance faciale et le regroupement. CVPR 2015.

Perte du triplet :

La classe tripletmnist échantillonne un exemple positif et négatif pour chaque ancre possible.

Après 20 époques de formation, voici les intérêts que nous obtenons pour un ensemble de formation:

Ensemble de tests:

Les incorporations apprises ne sont pas aussi proches les unes des autres en classe que dans le cas du réseau siamois, mais ce n'est pas pour cela que nous les avons optimisés. Nous voulions que les intérêts soient plus proches des autres intégres de la même classe que des autres classes et nous pouvons voir que c'est là que la formation va.

Sélection de paire / triplet en ligne - Mine négative

Il y a quelques problèmes avec les réseaux siamois et triplet:

Le nombre de paires / triplets possibles augmente quadratique / cubique avec le nombre d'exemples. Il est impossible de les traiter tous et la formation converge lentement.
Nous générons des paires / triplets au hasard . Au fur et à mesure que la formation se poursuit, de plus en plus de paires / triplets sont faciles à gérer (leur valeur de perte est très petite ou même 0), empêchant le réseau de s'entraîner . Nous devons fournir au réseau des exemples difficiles .
Chaque image qui est alimentée au réseau est utilisée uniquement pour le calcul de la perte contrastive / triplet pour une seule paire / triplet. Le calcul est quelque peu gaspillé; Une fois l'incorporation calculée, il pourrait être réutilisé pour de nombreuses paires / triplets.

Pour traiter ces problèmes efficacement, nous allons nourrir un réseau avec des mini-lots standard comme nous l'avons fait pour la classification. La fonction de perte sera responsable de la sélection de paires dures et de triplets dans le mini-lot. Si nous nourrissons le réseau avec 16 images par 10 classes, nous pouvons traiter jusqu'à 159 * 160/2 = 12720 paires et 10 * 16 * 15/2 * (9 * 16) = 172800 triplés, par rapport à 80 paires et 53 triplés lors de l'implémentation précédente.

Habituellement, ce n'est pas la meilleure idée de traiter toutes les paires ou triplets possibles dans un mini-lot. Nous pouvons trouver des stratégies sur la façon de sélectionner les triplés dans [2] et [3].

Sélection de paires en ligne

Nous allons nourrir un réseau avec des mini-lots, comme nous l'avons fait pour le réseau de classification. Cette fois, nous utiliserons un échantillonnage spécial qui dégustera n_classes et n_s échantillons dans chaque classe, ce qui entraînera des mini lots de taille n_classes * n_s échantillons .

Pour chaque mini lot, les paires positives et négatives seront sélectionnées à l'aide d'étiquettes fournies.

MNIST est un ensemble de données assez facile et les incorporations des paires sélectionnées au hasard étaient déjà assez bonnes, nous ne voyons pas beaucoup d'amélioration ici.

TRAIN ANGRANDDINGS:

Tester les incorporations:

Sélection de triplet en ligne

Nous allons nourrir un réseau avec des mini-lots comme avec la sélection des paires en ligne. Il y a quelques stratégies que nous pouvons utiliser pour la sélection des triplet donnant des étiquettes et des intérêts prévus:

Tous les triplets possibles (pourraient être trop)
Le plus dur négatif pour chaque paire positive (se traduira par le même négatif pour chaque ancre)
Négatif dur aléatoire pour chaque paire positive (considérez uniquement les triplets avec une valeur de perte de triplet positive)
Semi-dure négatif pour chaque paire positive (similaire à [2])

La stratégie de sélection des triplet doit être choisie avec soin. Une mauvaise stratégie peut conduire à une formation inefficace ou, pire encore, à un effondrement de modélisation (toutes les incorporations finissent par avoir les mêmes valeurs).

Voici ce que nous avons obtenu avec des négatifs durs aléatoires pour chaque paire positive.

Ensemble de formation:

Ensemble de tests:

Mode

Des expériences similaires ont été menées pour un ensemble de données de mode de mode où les avantages de l'exploitation négative en ligne sont légèrement plus visibles. La même architecture de réseau exacte avec seulement des intérêts bidimensionnelles a été utilisée, ce qui n'est probablement pas assez complexe pour apprendre de bonnes intérêts. Des ensembles de données plus complexes avec des classes de nombres plus élevés devraient bénéficier encore plus de l'exploitation minière en ligne.

Classification de base

Siamois vs perte contrastive en ligne avec l'exploitation négative

Réseau siamois avec des paires sélectionnées au hasard

Perte contrastive en ligne avec l'exploitation négative

Triplet vs Perte de triplet en ligne avec une mine négative

Réseau de triplet avec triplets aléatoires

Perte de triplet en ligne avec une minière négative

FAIRE

Optimiser la sélection du triplet
Évaluer avec une métrique comparable entre les approches
Évaluez en un seul coup lorsque les classes de Test Set ne sont pas en jeu de train
Afficher l'exemple de sélection de triplet en ligne sur des ensembles de données plus difficiles

Références

[1] Raia Hadsell, Sumit Chopra, Yann LeCun, Réduction de la dimensionnalité en apprenant une cartographie invariante, CVPR 2006

[2] Schroff, Florian, Dmitry Kalenichenko et James Philbin. Facenet: Une intégration unifiée pour la reconnaissance faciale et le regroupement. CVPR 2015

[3] Alexander Hermans, Lucas Beyer, Bastian Leibe, en défense de la perte de triplet pour la réidentification des personnes, 2017

[4] Brandon Amos, Bartosz Ludwiczuk, Mahadev Satyanarayanan, Openface: une bibliothèque de reconnaissance faciale à usage général avec applications mobiles, 2016

[5] Yi Sun, Xiaogang Wang, Xiaoou Tang, Deep Learning Face Représentation par la vérification de l'identification conjointe, NIPS 2014

Développer

Informations supplémentaires