deep person reid Téléchargement - deep person reid Code source Téléchargement

deep person reid

Python

v1.0.6

Télécharger

Torcheide

Torchreid est une bibliothèque pour la réidentification de la personne d'apprentissage en profondeur, écrite en pytorch et développée pour notre projet ICCV'19, l'apprentissage des fonctionnalités omni-échelle pour la réidentification des personnes.

Il s'agit de fonctionnalités:

Formation multi-GPU
Prise en charge de l'image et de la rédaction vidéo
Formation et évaluation de bout en bout
Préparation incroyablement facile des ensembles de données Reid
Formation multi-dataset
Évaluation des datasettes
Protocole standard utilisé par la plupart des articles de recherche
Très extensible (facile à ajouter des modèles, ensembles de données, méthodes de formation, etc.)
Implémentations de modèles Reid profonds de pointe
Accès aux modèles Reid pré-entraînés
techniques de formation avancées
Outils de visualisation (Tensorboard, rangs, etc.)

Code: https://github.com/kaiyangzhou/deep-serson-reid.

Documentation: https://kaiyangzhou.github.io/deep-serson-reid/.

Instructions pratiques: https://kaiyangzhou.github.io/deep-serson-reid/user_guide.

Modèle Zoo: https://kaiyangzhou.github.io/deep-serson-reid/model_zoo.

Rapport technologique: https://arxiv.org/abs/1910.10093.

Vous pouvez trouver des projets de recherche construits sur Torchreid ici.

Quoi de neuf

[Août 2022] Nous avons ajouté des capacités d'exportation de modèle vers les cadres suivants: ONNX, OpenVino et Tflite. Le script d'exportation peut être trouvé ici
[Août 2021] Nous avons publié les modèles prétraités par l'imaget d' osnet_ain_x0_75 , osnet_ain_x0_5 et osnet_ain_x0_25 . La configuration de pré-formation suit les PYCL.
[Avr 2021] Nous avons mis à jour l'annexe dans la version TPAMI d'OSNET pour inclure les résultats dans le paramètre de généralisation du domaine multi-source. Les modèles formés se trouvent dans le Zoo du modèle.
[Avr 2021] Nous avons ajouté un script pour automatiser le processus de calcul des résultats moyens sur plusieurs divisions. Pour plus de détails, veuillez consulter tools/parse_test_res.py .
[Avril 2021] v1.4.0 : Nous avons ajouté l'ensemble de données de recherche de personne, Cuhk-Sysu. Veuillez consulter la documentation sur la façon de télécharger l'ensemble de données (il contient des images de personne recadrées).
[Avr 2021] Tous les modèles du Zoo du modèle ont été déplacés vers Google Drive. Veuillez soulever un problème si les performances d'un modèle sont incompatibles avec les chiffres indiqués dans la page du zoo du modèle (pourrait être causé par de mauvais liens).
[Mars 2021] OSNET apparaîtra dans le journal TPAMI! Par rapport à la version de la conférence, qui se concentre sur l'apprentissage discriminant des fonctionnalités à l'aide du bloc de construction Omni à l'échelle, cette extension de journal considère en outre l'apprentissage des fonctionnalités généralisables en intégrant les couches de normalisation des instances avec l'architecture OSNET. Nous espérons que ce document de journal pourra motiver davantage de travaux futurs pour taclke le problème de généralisation dans RE-Dataset Reid.
[MAR 2021] La généralisation entre les domaines (ensembles de données) en personne est cruciale dans les applications du monde réel, qui est étroitement liée au sujet de la généralisation du domaine . Vous souhaitez apprendre comment le domaine de la généralisation du domaine s'est développé au cours de la dernière décennie? Vérifiez notre récente enquête dans ce sujet à https://arxiv.org/abs/2103.02503, avec une couverture sur l'histoire, les ensembles de données, les problèmes connexes, les méthodologies, les directions potentielles, etc. ( les méthodes conçues pour les re-Generalisables sont également couvertes !).
[Février 2021] v1.3.6 Ajout de l'université-1652, un nouvel ensemble de données pour la géo-localisation multi-visualités (crédit à Zhedong Zheng).
[Février 2021] v1.3.5 : Maintenant, le code cython fonctionne sur Windows (crédit à Lablabla).
[Janvier 2021] Notre travail récent, Mixstyle (mélange des statistiques de caractéristiques au niveau de l'instance d'échantillons de différents domaines pour améliorer la généralisation du domaine), a été accepté dans ICLR'21. Le code a été publié sur https://github.com/kaiyangzhou/mixstyle-release où la partie de la personne est basée sur Torcheid.
[Janvier 2021] Une nouvelle métrique d'évaluation appelée pénalité moyenne négative inverse (MINP) pour la personne Reid a été introduite dans l'apprentissage en profondeur pour la réidentification des personnes: une enquête et des perspectives (TPAMI 2021). Leur code est accessible sur https://github.com/mangye16/reid-survey.
[Août 2020] v1.3.3 : Correction du bug dans visrank (causé par le non-déballage dsetid ).
[Août 2020] v1.3.2 : Ajout _junk_pids à grid et prid . Cela évite d'utiliser des images de galerie mal étiquetées pour la formation lors de la définition combineall=True .
[Août 2020] v1.3.0 : (1) Ajout dsetid à la source de données à 3-Tupile existante, résultant en (impath, pid, camid, dsetid) . Cette variable désigne l'ID de jeu de données et est utile lors de la combinaison de plusieurs ensembles de données pour la formation (en tant qu'indicateur de jeu de données). Par exemple, lors de la combinaison market1501 et cuhk03 , le premier sera attribué dsetid=0 tandis que le second sera attribué dsetid=1 . (2) Ajout de RandomDatasetSampler . Analogue à RandomDomainSampler , RandomDatasetSampler échantillonne un certain nombre d'images ( batch_size // num_datasets ) de chacun des ensembles de données spécifiés (la quantité est déterminée par num_datasets ).
[Août 2020] v1.2.6 : Ajout de RandomDomainSampler (il échantillonne les caméras num_cams chacune avec des images batch_size // num_cams pour former un mini-lots).
[Juin 2020] v1.2.5 : (1) La sortie de Dataloader de __getitem__ est passée de list en passant par dict . Auparavant, un élément, par exemple, le tenseur d'image, a été récupéré avec imgs=data[0] . Maintenant, il doit être obtenu par imgs=data['img'] . Voir cet engagement pour des changements détaillés. (2) Ajout k_tfm en option de chargeur de données d'image, ce qui permet à l'augmentation des données d'être appliquée k_tfm à des heures indépendamment à une image. Si k_tfm > 1 , imgs=data['img'] renvoie une liste avec les tenseurs d'image k_tfm .
[Mai 2020] Ajout du code de reconnaissance d'attribut de personne utilisé dans l'apprentissage des fonctionnalités omni pour la réidentification de la personne (ICCV'19). Voir projects/attribute_recognition/ .
[Mai 2020] v1.2.1 : Ajout d'une API simple pour l'extraction de fonctionnalités ( torchreid/utils/feature_extractor.py ). Voir la documentation de l'instruction.
[Avr 2020] Code de reproduction des expériences d'apprentissage mutuel profond dans l'article OSNET (Supp. B) a été publié chez projects/DML .
[Avril 2020] Mise à niveau vers v1.2.0 . La classe moteur a été rendue plus agnostique du modèle pour améliorer l'extensibilité. Voir le moteur et les images ImagesoftMaxEngine pour plus de détails. Crédit à dassl.pytorch.
[Déc 2019] Notre article OSNET a été mis à jour, avec des expériences supplémentaires (dans la section B du supplément) montrant des techniques utiles pour améliorer les performances d'Osnet dans la pratique.
[Nov 2019] ImageDataManager peut charger des données de formation à partir de ensembles de données cibles en définissant load_train_targets=True , et le trains est accessible avec train_loader_t = datamanager.train_loader_t . Cette fonctionnalité est utile pour la recherche sur l'adaptation du domaine.

Installation

Assurez-vous que Conda est installé.

 # cd to your preferred directory and clone this repo
git clone https://github.com/KaiyangZhou/deep-person-reid.git

# create environment
cd deep-person-reid/
conda create --name torchreid python=3.7
conda activate torchreid

# install dependencies
# make sure `which python` and `which pip` point to the correct path
pip install -r requirements.txt

# install torch and torchvision (select the proper cuda version to suit your machine)
conda install pytorch torchvision cudatoolkit=9.0 -c pytorch

# install torchreid (don't need to re-build it if you modify the source code)
python setup.py develop

Une autre façon d'installer est d'exécuter tout dans le conteneur Docker:

construire: make build-image
Courir: make run

Commencez: 30 secondes à Torcheid

Importer torchreid

 import torchreid

Charger le gestionnaire de données

 datamanager = torchreid . data . ImageDataManager (
    root = "reid-data" ,
    sources = "market1501" ,
    targets = "market1501" ,
    height = 256 ,
    width = 128 ,
    batch_size_train = 32 ,
    batch_size_test = 100 ,
    transforms = [ "random_flip" , "random_crop" ]
)

3 Modèle de construction, Optimiseur et LR_Scheduler

 model = torchreid . models . build_model (
    name = "resnet50" ,
    num_classes = datamanager . num_train_pids ,
    loss = "softmax" ,
    pretrained = True
)

model = model . cuda ()

optimizer = torchreid . optim . build_optimizer (
    model ,
    optim = "adam" ,
    lr = 0.0003
)

scheduler = torchreid . optim . build_lr_scheduler (
    optimizer ,
    lr_scheduler = "single_step" ,
    stepsize = 20
)

Construire un moteur

 engine = torchreid . engine . ImageSoftmaxEngine (
    datamanager ,
    model ,
    optimizer = optimizer ,
    scheduler = scheduler ,
    label_smooth = True
)

Suivre une formation et un test

 engine . run (
    save_dir = "log/resnet50" ,
    max_epoch = 60 ,
    eval_freq = 10 ,
    print_freq = 10 ,
    test_only = False
)

Une interface unifiée

Dans "Deep-Person-Reid / Scripts /", nous fournissons une interface unifiée pour entraîner et tester un modèle. Voir "scripts / main.py" et "scripts / default_config.py" pour plus de détails. Le dossier "Configs /" contient des configurations prédéfinies que vous pouvez utiliser comme point de départ.

Ci-dessous, nous fournissons un exemple pour former et tester OSNET (Zhou et al. ICCV'19). Supposons que PATH_TO_DATA soit le répertoire contenant des ensembles de données REID. La variable environnementale CUDA_VISIBLE_DEVICES est omise, ce que vous devez spécifier si vous avez un pool de GPU et que vous souhaitez en utiliser un ensemble spécifique.

Cadre conventionnel

Pour former OSNET sur Market1501, faites

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
--transforms random_flip random_erase 
--root $PATH_TO_DATA

Le fichier config définit Market1501 comme ensemble de données par défaut. Si vous voulez utiliser dukemtmc-reid, faites

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
-s dukemtmcreid 
-t dukemtmcreid 
--transforms random_flip random_erase 
--root $PATH_TO_DATA 
data.save_dir log/osnet_x1_0_dukemtmcreid_softmax_cosinelr

Le code sera automatiquement (télécharger et) charger les poids pré-entraînés ImageNet. Une fois la formation terminée, le modèle sera enregistré comme "Log / OSNET_X1_0_MARKET1501_SOFTMAX_COSINELR / MODÈLE.PTH.TAR-250". Dans le même dossier, vous pouvez trouver le fichier Tensorboard. Pour visualiser les courbes d'apprentissage à l'aide de Tensorboard, vous pouvez exécuter tensorboard --logdir=log/osnet_x1_0_market1501_softmax_cosinelr dans le terminal et visitez http://localhost:6006/ dans votre navigateur Web.

L'évaluation est automatiquement effectuée à la fin de la formation. Pour exécuter le test à nouveau en utilisant le modèle formé, faites

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
--root $PATH_TO_DATA 
model.load_weights log/osnet_x1_0_market1501_softmax_cosinelr/model.pth.tar-250 
test.evaluate True

Paramètre de domaine croisé

Supposons que vous vouliez former OSNET sur Dukemtmc-Reid et tester ses performances sur Market1501, vous pouvez faire

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad.yaml 
-s dukemtmcreid 
-t market1501 
--transforms random_flip color_jitter 
--root $PATH_TO_DATA

Ici, nous ne testons que les performances du domaine croisé. Cependant, si vous souhaitez également tester les performances sur l'ensemble de données source, c'est-à-dire Dukemtmc-Reid, vous pouvez définir -t dukemtmcreid market1501 , qui évaluera le modèle sur les deux ensembles de données séparément.

Différent du paramètre de même domaine, nous remplaçons ici random_erase par color_jitter . Cela peut améliorer les performances de généralisation sur l'ensemble de données cible invisible.

Des modèles pré-entraînés sont disponibles dans le Zoo du modèle.

Ensembles de données

Ensembles de données d'image-reid

Marché1501
CUHK03
Dukemtmc-reid
MSMT17
Vipère
GRILLE
CUHK01
Sensereid
QMUL-ILIDS
Pari

Ensembles de données de géo-localisation

Université-1652

Ensembles de données vidéo-reid

MARS
ilids-vid
Prid2011
Dukemtmc-videoreid

Modèles

Modèles de classification ImageNet

Resnet
Resnext
Senet
Denset
Inception-Resnet-V2
Inception-V4
Xception
Ibn-net

Modèles légers

Nasnet
Mobilenetv2
Shufflenet
Shufflenetv2
Serrer

Modèles spécifiques à Reid

Mudeep
Resnet-Mid
Hacnn
PCB
Mlfn
OSNET
Osnet-Ain

Liens utiles

OSNET-IBN1-LITE (code de test uniquement avec un conteneur Docker Lite)
Apprentissage en profondeur pour la réidentification des personnes: une enquête et des perspectives

Citation

Si vous utilisez ce code ou les modèles dans votre recherche, veuillez rendre hommage aux articles suivants:

@article{torchreid,
  title={Torchreid: A Library for Deep Learning Person Re-Identification in Pytorch},
  author={Zhou, Kaiyang and Xiang, Tao},
  journal={arXiv preprint arXiv:1910.10093},
  year={2019}
}

@inproceedings{zhou2019osnet,
  title={Omni-Scale Feature Learning for Person Re-Identification},
  author={Zhou, Kaiyang and Yang, Yongxin and Cavallaro, Andrea and Xiang, Tao},
  booktitle={ICCV},
  year={2019}
}

@article{zhou2021osnet,
  title={Learning Generalisable Omni-Scale Representations for Person Re-Identification},
  author={Zhou, Kaiyang and Yang, Yongxin and Cavallaro, Andrea and Xiang, Tao},
  journal={TPAMI},
  year={2021}
}

Développer

Informations supplémentaires

Version v1.0.6
Type Python
Date de mise à jour 2025-07-11
taille 440.07KB
Provenant de Github

Applications connexes

Jeu d'information sur les personnes suspectes version chinoise

2024-07-20
Champ profond

2023-07-07
Jeu Deep Hunter

2023-07-03
Di profond

2022-08-30
Course profonde : bataille

2022-08-29
Rune profonde

2022-07-25

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ToDo Co

Python

1.0.0
Python Portfolio

Python
Outil de création de graphiques de données open source Redash v24.10.0

Python

24.10.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout