pytorch metric learning Download - pytorch metric learning Téléchargement du code source

pytorch metric learning

Python

v2.8.1

Télécharger

Nouvelles

11 décembre : v2.8.0

Ajout du module d'ensembles de données pour le téléchargement facile des ensembles de données communs:
- Cub200
- CARS196
- Inaturalist 2018
- Produits en ligne de Stanford
Merci IR2718.

2 novembre : v2.7.0

Ajout de seuils de marginloss consommés.
Merci IR2718.

Documentation

Consultez la documentation ici
Consultez les instructions d'installation ici
Consultez les pertes, mineurs disponibles, etc. ici

Exemples Google Colab

Voir le dossier Exemples pour les ordinateurs portables que vous pouvez télécharger ou exécuter sur Google Colab.

Aperçu de l'apprentissage métrique de Pytorch

Cette bibliothèque contient 9 modules, dont chacun peut être utilisé indépendamment dans votre base de code existante, ou combinée ensemble pour un flux de travail de train / test complet.

high_level_module_overview

Comment fonctionnent les fonctions de perte

Utilisation de pertes et de mineurs dans votre boucle de formation

Initialisons un simple tripletmarginloss:

 from pytorch_metric_learning import losses
loss_func = losses . TripletMarginLoss ()

Pour calculer la perte dans votre boucle d'entraînement, passez dans les intérêts calculés par votre modèle et les étiquettes correspondantes. Les incorporations doivent avoir de la taille (n, embedding_size), et les étiquettes doivent avoir la taille (n), où n est la taille du lot.

 # your training loop
for i , ( data , labels ) in enumerate ( dataloader ):
	optimizer . zero_grad ()
	embeddings = model ( data )
	loss = loss_func ( embeddings , labels )
	loss . backward ()
	optimizer . step ()

Le tripletmarginloss calcule tous les triplets possibles dans le lot, en fonction des étiquettes que vous y transmettez. Les paires d'ancrage positives sont formées par des intégres qui partagent la même étiquette, et les paires d'ancrage négatives sont formées par des intérêts qui ont des étiquettes différentes.

Parfois, cela peut aider à ajouter une fonction minière:

 from pytorch_metric_learning import miners , losses
miner = miners . MultiSimilarityMiner ()
loss_func = losses . TripletMarginLoss ()

# your training loop
for i , ( data , labels ) in enumerate ( dataloader ):
	optimizer . zero_grad ()
	embeddings = model ( data )
	hard_pairs = miner ( embeddings , labels )
	loss = loss_func ( embeddings , labels , hard_pairs )
	loss . backward ()
	optimizer . step ()

Dans le code ci-dessus, le mineur trouve des paires positives et négatives qui, selon eux, sont particulièrement difficiles. Notez que même si le tripletmarginloss fonctionne sur des triplés, il est toujours possible de passer par paires. En effet, la bibliothèque convertit automatiquement les paires en triplets et triplets en paires, si nécessaire.

Personnalisation des fonctions de perte

Les fonctions de perte peuvent être personnalisées à l'aide de distances, de réducteurs et de régulateurs. Dans le diagramme ci-dessous, un mineur trouve les indices de paires dures dans un lot. Ceux-ci sont utilisés pour indexer dans la matrice de distance, calculés par l'objet de distance. Pour ce diagramme, la fonction de perte est basée sur la paire, il calcule donc une perte par paire. De plus, un régulariseur a été fourni, donc une perte de régularisation est calculée pour chaque intégration dans le lot. Les pertes par paire et par éléments sont transmises au réducteur, qui (dans ce diagramme) ne conserve que des pertes avec une valeur élevée. Les moyennes sont calculées pour les pertes de paires et d'éléments à valeur élevée, puis sont additionnées pour obtenir la perte finale.

high_level_loss_function_overview

Voici maintenant un exemple de tripletmarginloss personnalisé:

 from pytorch_metric_learning . distances import CosineSimilarity
from pytorch_metric_learning . reducers import ThresholdReducer
from pytorch_metric_learning . regularizers import LpRegularizer
from pytorch_metric_learning import losses
loss_func = losses . TripletMarginLoss ( distance = CosineSimilarity (), 
				     reducer = ThresholdReducer ( high = 0.3 ), 
			 	     embedding_regularizer = LpRegularizer ())

Cette perte de triplet personnalisée a les propriétés suivantes:

La perte sera calculée en utilisant la similitude du cosinus au lieu de la distance euclidienne.
Toutes les pertes de triplet supérieures à 0,3 seront rejetées.
Les intérêts seront régularisés en L2.

Utilisation de fonctions de perte pour un apprentissage non supervisé / auto-supervisé

Un emballage SelfSupervisedLoss est fourni pour l'apprentissage auto-supervisé:

 from pytorch_metric_learning . losses import SelfSupervisedLoss
loss_func = SelfSupervisedLoss ( TripletMarginLoss ())

# your training for-loop
for i , data in enumerate ( dataloader ):
	optimizer . zero_grad ()
	embeddings = your_model ( data )
	augmented = your_model ( your_augmentation ( data ))
	loss = loss_func ( embeddings , augmented )
	loss . backward ()
	optimizer . step ()

Si vous êtes intéressé par l'auto-supervision de style MOCO, jetez un œil au cahier MOCO sur CIFAR10. Il utilise CrossBatchMemory pour implémenter la file d'attente de l'encodeur de momentum, ce qui signifie que vous pouvez utiliser n'importe quelle perte de tuple et n'importe quel mineur de tuple pour extraire des échantillons durs de la file d'attente.

Faits saillants du reste de la bibliothèque

Pour un moyen pratique de former votre modèle, jetez un œil aux formateurs.
Vous voulez tester la précision de votre modèle sur un ensemble de données? Essayez les testeurs.
Pour calculer directement la précision d'un espace d'incorporation, utilisez la précision de la précision.

Si vous êtes à court de temps et que vous souhaitez un workflow de train / test complet, consultez l'exemple de cahiers Google Colab.

Pour en savoir plus sur tout ce qui précède, voir la documentation.

Installation

Version Pytorch requise

pytorch-metric-learning >= v0.9.90 nécessite torch >= 1.6
pytorch-metric-learning < v0.9.90 n'a pas d'exigence de version, mais a été testé avec torch >= 1.2

Autres dépendances: numpy, scikit-learn, tqdm, torchvision

Pépin

 pip install pytorch-metric-learning

Pour obtenir la dernière version Dev :

 pip install pytorch-metric-learning --pre

Pour installer sur Windows :

 pip install torch===1.6.0 torchvision===0.7.0 -f https://download.pytorch.org/whl/torch_stable.html
pip install pytorch-metric-learning

Pour installer avec des capacités d'évaluation et de journalisation

(Cela installera la version non officielle de PYPI de FAISS-GPU, plus le gardien de dossier et le tensorboard):

 pip install pytorch-metric-learning[with-hooks]

Pour installer avec des capacités d'évaluation et de journalisation (CPU)

(Cela installera la version non officielle de PYPI de FAISS-CPU, plus le gardien de disques et Tensorboard):

 pip install pytorch-metric-learning[with-hooks-cpu]

Conda

 conda install -c conda-forge pytorch-metric-learning

Pour utiliser le module de test, vous aurez besoin de Faish, qui peut également être installé via Conda. Voir les instructions d'installation pour FAISS.

Résultats de référence

Voir le marché de bench-bench pour afficher les résultats de référence et pour utiliser l'outil d'analyse comparative.

Développement

Le développement se fait sur la branche dev :

 git checkout dev

Les tests unitaires peuvent être exécutés avec la bibliothèque unittest par défaut:

python -m unittest discover

Vous pouvez spécifier les données de test et le périphérique de test sous forme de variables d'environnement. Par exemple, pour tester en utilisant Float32 et Float64 sur le CPU:

TEST_DTYPES=float32,float64 TEST_DEVICE=cpu python -m unittest discover

Pour exécuter un seul fichier de test au lieu de toute la suite de test, spécifiez le nom du fichier:

python -m unittest tests/losses/test_angular_loss.py

Le code est formaté à l'aide black et isort :

pip install black isort
./format_code.sh

Remerciements

Contributeurs

Merci aux contributeurs qui ont fait des demandes de traction!

Donateur	Points forts
domenicomuscill0	- manifoldloss - P2Sgradloss - Histogrogloss - dynamicsoftmarginloss - ClassedListloss
mlopezantesera	- Faire travailler les testeurs sur n'importe quelle combinaison de requêtes et d'ensembles de référence - La précision de la précision fonctionne avec des comparaisons arbitraires
cwkeam	- auto-upéralisé - vicregloss - Ajout de la précision moyenne du classement réciproque à la précision - Baselosswrapper
IR2718	- ThresholdConsistentMarginloss - Le module de jeu de données
marijnl	- Batcheasyhardmin - Twostreammetricloss - GlobalTwostreamembeddingsPaceTester - Exemple à l'aide de formateurs.twostreammetricloss
chingisoinar	Subcenterarcfaceloss
Elias-Ramzi	Échantillonneur hiérarchique
FJSJ	Supconloss
Alenubuntu	Circleloss
intéressantzhuo	Ploss
wconnell	Apprendre une intégration métrique Scrnaseq
mkmenta	Amélioré `get_all_triplets_indices` (Correction de l'erreur `INT_MAX` )
Alexschuy	optimisé `utils.loss_and_miner_utils.get_random_triplet_indices`
Johngiorgi	`all_gather` in utils.Distributed
Hummer12007	`utils.key_checker`
vltanh	Fait `InferenceModel.train_indexer` accepter les ensembles de données
btseytlin	`get_nearest_neighbors` dans inférencemodel
MLW214	Ajout `return_per_class` à la précision
Layumi	Instanceloss
Notation	A aidé à ajouter `ref_emb` et `ref_labels` aux wrappers distribués.
Elisonsherton	Correction d'un boîtier de bord dans Arcfaceloss.
stompsjo	Documentation améliorée pour ntxentloss.
Galerie	Correction de bugs pour PNPLOSS.
Elisim	Améliorations des développeurs à DistributedLosswrapper.
Gaetanlepage
z1w
Thinline72
tpanum
fractive
Joaqo
Jokuma
gkouros
yutanakamura-tky
Kinglittleq
Martin0258
Michaeldeyzel
Hsinger04
rhume
bot66

Facebook AI

Merci à Ser-Nam Lim à Facebook AI et à mon conseiller de recherche, le professeur Serge Pleancie. Ce projet a commencé lors de mon stage à Facebook IA où j'ai reçu des commentaires précieux de Ser-Nam, et de son équipe d'ingénieurs de vision et d'apprentissage automatique et de chercheurs. En particulier, grâce à Ashish Shah et Austin Reiter pour avoir examiné mon code au cours de ses premiers stades de développement.

REPOSES OBRES

Cette bibliothèque contient du code qui a été adapté et modifié à partir des grandes références open source suivantes:

https://github.com/bnu-wangxun/deep_metric
https://github.com/chaoyuaw/incubator-mxnet/blob/master/example/gluon/embedding_learning
https://github.com/facebookresearch/deepcluster
https://github.com/geonm/proxy-anchor-loss
https://github.com/idstcv/softtriple
https://github.com/kunhe/fastap-metric-learning
https://github.com/ronekko/deep_metric_learning
https://github.com/tjddus9597/proxy-anchor-cvpr2020
http://kaizhao.net/regularface
https://github.com/nii-yamagishilab/project-nn-pytorch-scripts

Logo

Merci à Jeff Musgrave pour la conception du logo.

Citant cette bibliothèque

Si vous souhaitez citer le pytorch-métrique-apprentissage dans votre papier, vous pouvez utiliser ce bibtex:

@article{Musgrave2020PyTorchML,
  title={PyTorch Metric Learning},
  author={Kevin Musgrave and Serge J. Belongie and Ser-Nam Lim},
  journal={ArXiv},
  year={2020},
  volume={abs/2008.09164}
}

Développer

Informations supplémentaires

Version v2.8.1
Type Python
Date de mise à jour 2025-07-12
taille 24.47MB
Provenant de Github

Applications connexes

Parameter Efficient Transfer Learning Benchmark

2024-11-06
GitHub sgrebnov/cordova plugin background download

2024-11-05
pytorch image models

2024-11-03
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Apprentissage PHP5 (Apprentissage PHP)

2009-05-24
OReilly Learning PHP et MySQL 2e édition

2009-05-24

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ToDo Co

Python

1.0.0
Python Portfolio

Python
Outil de création de graphiques de données open source Redash v24.10.0

Python

24.10.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout