Téléchargement pretrained models.pytorch - Téléchargement du code source pretrained models.pytorch Téléchargement

pretrained models.pytorch

Python

1.0.0

Télécharger

Modèles pré-entraînés pour Pytorch (travail en cours)

Le but de ce dépôt est:

Pour aider à reproduire les résultats des documents de recherche (configurations d'apprentissage par transfert par exemple),
Pour accéder aux convaints pré-entraînés avec une interface / API unique inspirée de TorchVision.

Nouvelles:

27/10/2018: résoudre les problèmes de compatibilité, ajouter des tests, ajouter Travis
04/06/2018: Polynet et Pnasnet-5-Large Merci à Alex Pariov
16/04/2018: SE-RESNET * et SE-RESNEXT * Merci à Alex Parinov
09/04/2018: Senet154 Merci à Alex Pariov
22/03/2018: CafferesNet101 (bon pour la localisation avec plus rapide)
21/03/2018: NASNET MOBILE Merci à Veronika Yurchuk et Anastasiia
25/01/2018: DualPathNetworks Grâce à Ross Wightman, Xception grâce à T Standley, API Transformage améliorée
13/01/2018: pip install pretrainedmodels pretrainedmodels.pretrained_settings pretrainedmodels.model_names
12/01/2018: python setup.py install
08/12/2017: Mettre à jour l'URL des données (/! git pull est nécessaire)
30/11/2017: Améliorer l'API ( model.features(input) , model.logits(features) , model.forward(input) , model.last_linear )
16/11/2017: Modèle Nasnet-A-Large pré-entraîné par T. Durand et R. Cadene
22/07/2017: Modèles pré-entraînés TorchVision
22/07/2017: Momentum dans Inceptionv4 et INECCEPSRESNETV2 à 0.1
17/07/2017: Model.input_Range Attribute
17/07/2017: Bninception pré-entraînée sur ImageNet

Résumé

Installation
Exemples rapides
Peu de cas d'utilisation
- Calculer les logits d'imaget
- Calculer les mesures de validation ImageNet
Évaluation sur ImageNet
- Précision sur Valset
- Reproduction des résultats
Documentation
- Modèles disponibles
  - Alexnet
  - Bninception
  - Cafferesnet101
  - Densenet121
  - Densenet161
  - Densenet169
  - Densenet201
  - Densenet201
  - Dualpathnet68
  - Dualpathnet92
  - Dualpathnet98
  - Dualpathnet107
  - Dualpathnet113
  - FBRESNET152
  - INCECK RESRESNETV2
  - Inceptionv3
  - Inceptionv4
  - Nasnet-a-grand
  - Nasnet-a-mobile
  - PNASNET-5-GARD
  - Polynet
  - Resnext101_32x4d
  - Resnext101_64x4d
  - Resnet101
  - Resnet152
  - Resnet18
  - Resnet34
  - Resnet50
  - Senet154
  - SE-RESNET50
  - SE-RESNET101
  - SE-RESNET152
  - SE-RESNEXT50_32X4D
  - SE-RESNEXT101_32X4D
  - Squeezenet1_0
  - Squeezenet1_1
  - VGG11
  - VGG13
  - VGG16
  - VGG19
  - VGG11_BN
  - VGG13_BN
  - VGG16_BN
  - VGG19_BN
  - Xception
- API modèle
  - modèle.input_size
  - modèle.input_space
  - Model.input_Range
  - Model.mean
  - Model.std
  - modélisation
  - modèle.logits
  - modèle
Portage de reproduction
- Resnet *
- Resnext *
- Création*

Installation

Python3 avec anaconda
pytorch avec / out cuda

Installer à partir de pip

pip install pretrainedmodels

Installer à partir de repo

git clone https://github.com/Cadene/pretrained-models.pytorch.git
cd pretrained-models.pytorch
python setup.py install

Exemples rapides

Pour importer pretrainedmodels :

 import pretrainedmodels

Pour imprimer les modèles disponibles disponibles:

 print ( pretrainedmodels . model_names )
> [ 'fbresnet152' , 'bninception' , 'resnext101_32x4d' , 'resnext101_64x4d' , 'inceptionv4' , 'inceptionresnetv2' , 'alexnet' , 'densenet121' , 'densenet169' , 'densenet201' , 'densenet161' , 'resnet18' , 'resnet34' , 'resnet50' , 'resnet101' , 'resnet152' , 'inceptionv3' , 'squeezenet1_0' , 'squeezenet1_1' , 'vgg11' , 'vgg11_bn' , 'vgg13' , 'vgg13_bn' , 'vgg16' , 'vgg16_bn' , 'vgg19_bn' , 'vgg19' , 'nasnetalarge' , 'nasnetamobile' , 'cafferesnet101' , 'senet154' ,  'se_resnet50' , 'se_resnet101' , 'se_resnet152' , 'se_resnext50_32x4d' , 'se_resnext101_32x4d' , 'cafferesnet101' , 'polynet' , 'pnasnet5large' ]

Pour imprimer les paramètres pré-entraînés disponibles pour un modèle choisi:

 print ( pretrainedmodels . pretrained_settings [ 'nasnetalarge' ])
> { 'imagenet' : { 'url' : 'http://data.lip6.fr/cadene/pretrainedmodels/nasnetalarge-a1897284.pth' , 'input_space' : 'RGB' , 'input_size' : [ 3 , 331 , 331 ], 'input_range' : [ 0 , 1 ], 'mean' : [ 0.5 , 0.5 , 0.5 ], 'std' : [ 0.5 , 0.5 , 0.5 ], 'num_classes' : 1000 }, 'imagenet+background' : { 'url' : 'http://data.lip6.fr/cadene/pretrainedmodels/nasnetalarge-a1897284.pth' , 'input_space' : 'RGB' , 'input_size' : [ 3 , 331 , 331 ], 'input_range' : [ 0 , 1 ], 'mean' : [ 0.5 , 0.5 , 0.5 ], 'std' : [ 0.5 , 0.5 , 0.5 ], 'num_classes' : 1001 }}

Pour charger des modèles pré-entraînés de ImageNet:

 model_name = 'nasnetalarge' # could be fbresnet152 or inceptionresnetv2
model = pretrainedmodels . __dict__ [ model_name ]( num_classes = 1000 , pretrained = 'imagenet' )
model . eval ()

Remarque : Par défaut, les modèles seront téléchargés dans votre dossier $HOME/.torch . Vous pouvez modifier ce comportement en utilisant la variable $TORCH_HOME comme suit: export TORCH_HOME="/local/pretrainedmodels"

Pour charger une image et faire un laissez-passer avant complet:

 import torch
import pretrainedmodels . utils as utils

load_img = utils . LoadImage ()

# transformations depending on the model
# rescale, center crop, normalize, and others (ex: ToBGR, ToRange255)
tf_img = utils . TransformImage ( model ) 

path_img = 'data/cat.jpg'

input_img = load_img ( path_img )
input_tensor = tf_img ( input_img )         # 3x400x225 -> 3x299x299 size may differ
input_tensor = input_tensor . unsqueeze ( 0 ) # 3x299x299 -> 1x3x299x299
input = torch . autograd . Variable ( input_tensor ,
    requires_grad = False )

output_logits = model ( input ) # 1x1000

Pour extraire les fonctionnalités (méfiez-vous de cette API n'est pas disponible pour tous les réseaux):

 output_features = model . features ( input ) # 1x14x14x2048 size may differ
output_logits = model . logits ( output_features ) # 1x1000

Peu de cas d'utilisation

Calculer les logits d'imaget

Voir Exemples / ImageNet_Logits.py pour calculer les logits des classes d'apparence sur une seule image avec un modèle pré-entraîné sur ImageNet.

 $ python examples/imagenet_logits.py -h
> nasnetalarge, resnet152, inceptionresnetv2, inceptionv4, ...

 $ python examples/imagenet_logits.py -a nasnetalarge --path_img data/cat.jpg
> 'nasnetalarge': data/cat.jpg' is a 'tiger cat'

Calculer les mesures d'évaluation ImageNet

Voir Exemples / ImageNet_eval.py pour évaluer les modèles pré-entraînés sur ImageNet Valset.

 $ python examples/imagenet_eval.py /local/common-data/imagenet_2012/images -a nasnetalarge -b 20 -e
> * Acc@1 82.693, Acc@5 96.13

Évaluation sur ImageNet

Précision sur l'ensemble de validation (modèle unique)

Les résultats ont été obtenus en utilisant des images (centres recadrées) de la même taille que pendant le processus de formation.

Modèle	Version	Acc @ 1	Acc @ 5
PNASNET-5-GARD	Tensorflow	82.858	96.182
PNASNET-5-GARD	Notre portage	82.736	95.992
Nasnet-a-grand	Tensorflow	82.693	96.163
Nasnet-a-grand	Notre portage	82.566	96.086
Senet154	Caffe	81.32	95,53
Senet154	Notre portage	81.304	95.498
Polynet	Caffe	81.29	95,75
Polynet	Notre portage	81.002	95.624
INCECK RESRESNETV2	Tensorflow	80.4	95.3
Inceptionv4	Tensorflow	80.2	95.3
SE-RESNEXT101_32X4D	Notre portage	80.236	95.028
SE-RESNEXT101_32X4D	Caffe	80.19	95.04
INCECK RESRESNETV2	Notre portage	80.170	95.234
Inceptionv4	Notre portage	80.062	94.926
Dualpathnet107_5k	Notre portage	79.746	94.684
Resnext101_64x4d	Torch7	79.6	94.7
Dualpathnet131	Notre portage	79.432	94.574
Dualpathnet92_5k	Notre portage	79.400	94.620
Dualpathnet98	Notre portage	79.224	94.488
SE-RESNEXT50_32X4D	Notre portage	79.076	94.434
SE-RESNEXT50_32X4D	Caffe	79.03	94.46
Xception	Kéras	79.000	94.500
Resnext101_64x4d	Notre portage	78,956	94.252
Xception	Notre portage	78.888	94.292
Resnext101_32x4d	Torch7	78.8	94.4
SE-RESNET152	Caffe	78,66	94.46
SE-RESNET152	Notre portage	78,658	94.374
Resnet152	Pytorch	78.428	94.110
SE-RESNET101	Notre portage	78.396	94.258
SE-RESNET101	Caffe	78.25	94.28
Resnext101_32x4d	Notre portage	78.188	93.886
FBRESNET152	Torch7	77.84	93.84
SE-RESNET50	Caffe	77,63	93.64
SE-RESNET50	Notre portage	77.636	93.752
Densenet161	Pytorch	77.560	93.798
Resnet101	Pytorch	77.438	93.672
FBRESNET152	Notre portage	77.386	93.594
Inceptionv3	Pytorch	77.294	93.454
Densenet201	Pytorch	77.152	93.548
Dualpathnet68b_5k	Notre portage	77.034	93.590
Cafferesnet101	Caffe	76.400	92.900
Cafferesnet101	Notre portage	76.200	92.766
Densenet169	Pytorch	76.026	92.992
Resnet50	Pytorch	76.002	92.980
Dualpathnet68	Notre portage	75.868	92.774
Densenet121	Pytorch	74.646	92.136
VGG19_BN	Pytorch	74.266	92.066
Nasnet-a-mobile	Tensorflow	74.0	91.6
Nasnet-a-mobile	Notre portage	74.080	91.740
Resnet34	Pytorch	73.554	91.456
Bninception	Notre portage	73.524	91.562
VGG16_BN	Pytorch	73.518	91.608
VGG19	Pytorch	72.080	90.822
VGG16	Pytorch	71.636	90.354
VGG13_BN	Pytorch	71.508	90.494
VGG11_BN	Pytorch	70.452	89.818
Resnet18	Pytorch	70.142	89.274
VGG13	Pytorch	69.662	89.264
VGG11	Pytorch	68.970	88.746
Squeezenet1_1	Pytorch	58.250	80.800
Squeezenet1_0	Pytorch	58.108	80.428
Alexnet	Pytorch	56.432	79.194

Notes:

La version Pytorch de RESNET152 n'est pas un portage de la Torch7 mais a été recyclée par Facebook.
Pour l'évaluation de Polynet, chaque image a été redimensionnée à 378x378 sans préserver le rapport d'aspect, puis le patch central 331 × 331 de l'image résultante a été utilisé.

Méfiez-vous, la précision rapportée ici n'est pas toujours représentative de la capacité transférable du réseau sur d'autres tâches et ensembles de données. Vous devez tous les essayer! : P

Reproduction des résultats

Veuillez consulter les mesures de validation de calcul de calcul

Documentation

Modèles disponibles

Nasnet *

Source: Tensorflow Slim Repo

nasnetalarge(num_classes=1000, pretrained='imagenet')
nasnetalarge(num_classes=1001, pretrained='imagenet+background')
nasnetamobile(num_classes=1000, pretrained='imagenet')

Facebook Resnet *

Source: Torch7 Repo de Facebook

Il y a un peu différent de la resnet * de TorchVision. Resnet152 est actuellement le seul disponible.

fbresnet152(num_classes=1000, pretrained='imagenet')

Caffe Resnet *

Source: Caffe Repo de Kaiminghe

cafferesnet101(num_classes=1000, pretrained='imagenet')

Création*

Source: TensorFlow Slim Repo et Pytorch / Vision Repo pour inceptionv3

inceptionresnetv2(num_classes=1000, pretrained='imagenet')
inceptionresnetv2(num_classes=1001, pretrained='imagenet+background')
inceptionv4(num_classes=1000, pretrained='imagenet')
inceptionv4(num_classes=1001, pretrained='imagenet+background')
inceptionv3(num_classes=1000, pretrained='imagenet')

Bninception

Source: Formé avec Caffe par Xiong Yuanjun

bninception(num_classes=1000, pretrained='imagenet')

Resnext *

Source: Resnext Repo de Facebook

resnext101_32x4d(num_classes=1000, pretrained='imagenet')
resnext101_62x4d(num_classes=1000, pretrained='imagenet')

Dualpathnetworks

Source: Mxnet Repo de Chen Yunpeng

Le portage a été rendu possible par Ross Wightman dans son dépôt de pytorch.

Comme vous pouvez le voir ici, DualPathNetworks vous permet d'essayer différentes échelles. Le par défaut dans ce dépôt est de 0,875, ce qui signifie que la taille d'entrée d'origine est de 256 avant la culture à 224.

dpn68(num_classes=1000, pretrained='imagenet')
dpn98(num_classes=1000, pretrained='imagenet')
dpn131(num_classes=1000, pretrained='imagenet')
dpn68b(num_classes=1000, pretrained='imagenet+5k')
dpn92(num_classes=1000, pretrained='imagenet+5k')
dpn107(num_classes=1000, pretrained='imagenet+5k')

'imagenet+5k' signifie que le réseau a été pré-étiré sur ImageNet5k avant d'être finetumé sur ImageNet1k.

Xception

Source: Repo Keras

Le portage a été rendu possible par T Standley.

xception(num_classes=1000, pretrained='imagenet')

Senet *

Source: Caffe Repo de Jie Hu

senet154(num_classes=1000, pretrained='imagenet')
se_resnet50(num_classes=1000, pretrained='imagenet')
se_resnet101(num_classes=1000, pretrained='imagenet')
se_resnet152(num_classes=1000, pretrained='imagenet')
se_resnext50_32x4d(num_classes=1000, pretrained='imagenet')
se_resnext101_32x4d(num_classes=1000, pretrained='imagenet')

Pnasnet *

Source: Tensorflow Slim Repo

pnasnet5large(num_classes=1000, pretrained='imagenet')
pnasnet5large(num_classes=1001, pretrained='imagenet+background')

Polynet

Source: Caffe Repo du laboratoire multimédia CUHK

polynet(num_classes=1000, pretrained='imagenet')

Torchion

Source: Pytorch / Vision Repo

( inceptionv3 inclus dans Inception *)

resnet18(num_classes=1000, pretrained='imagenet')
resnet34(num_classes=1000, pretrained='imagenet')
resnet50(num_classes=1000, pretrained='imagenet')
resnet101(num_classes=1000, pretrained='imagenet')
resnet152(num_classes=1000, pretrained='imagenet')
densenet121(num_classes=1000, pretrained='imagenet')
densenet161(num_classes=1000, pretrained='imagenet')
densenet169(num_classes=1000, pretrained='imagenet')
densenet201(num_classes=1000, pretrained='imagenet')
squeezenet1_0(num_classes=1000, pretrained='imagenet')
squeezenet1_1(num_classes=1000, pretrained='imagenet')
alexnet(num_classes=1000, pretrained='imagenet')
vgg11(num_classes=1000, pretrained='imagenet')
vgg13(num_classes=1000, pretrained='imagenet')
vgg16(num_classes=1000, pretrained='imagenet')
vgg19(num_classes=1000, pretrained='imagenet')
vgg11_bn(num_classes=1000, pretrained='imagenet')
vgg13_bn(num_classes=1000, pretrained='imagenet')
vgg16_bn(num_classes=1000, pretrained='imagenet')
vgg19_bn(num_classes=1000, pretrained='imagenet')

API modèle

Une fois qu'un modèle pré-entraîné a été chargé, vous pouvez l'utiliser de cette façon.

Remarque importante : Toute l'image doit être chargée à l'aide PIL qui échelle les valeurs de pixels entre 0 et 1.

`model.input_size`

Attribute de list de types composée de 3 nombres:

Nombre de canaux de couleur,
hauteur de l'image d'entrée,
Largeur de l'image d'entrée.

Exemple:

[3, 299, 299] pour les réseaux de création *,
[3, 224, 224] pour les réseaux Resnet *.

`model.input_space`

Attribute de type str représentant l'espace colorimétrique de l'image. Peut être RGB ou BGR .

`model.input_range`

Attribute de list de types composée de 2 nombres:

Valeur de pixels min,
Valeur de pixel maximale.

Exemple:

[0, 1] pour les réseaux Resnet * et Inception *,
[0, 255] pour le réseau de bninception.

`model.mean`

Attribute de list de types composée de 3 nombres qui sont utilisés pour normaliser l'image d'entrée (soustraire "couleurs-canal").

Exemple:

[0.5, 0.5, 0.5] pour les réseaux de création *,
[0.485, 0.456, 0.406] pour les réseaux Resnet *.

`model.std`

Attribute de list de types composée de 3 nombres qui sont utilisés pour normaliser l'image d'entrée (diviser le "canal de couleur").

Exemple:

[0.5, 0.5, 0.5] pour les réseaux de création *,
[0.229, 0.224, 0.225] pour les réseaux Resnet *.

`model.features`

/! travail en cours (peut ne pas être disponible)

Méthode qui est utilisée pour extraire les fonctionnalités de l'image.

Exemple lorsque le modèle est chargé à l'aide de fbresnet152 :

 print ( input_224 . size ())            # (1,3,224,224)
output = model . features ( input_224 ) 
print ( output . size ())               # (1,2048,1,1)

# print(input_448.size())          # (1,3,448,448)
output = model . features ( input_448 )
# print(output.size())             # (1,2048,7,7)

`model.logits`

/! travail en cours (peut ne pas être disponible)

Méthode qui est utilisée pour classer les fonctionnalités de l'image.

Exemple lorsque le modèle est chargé à l'aide de fbresnet152 :

 output = model . features ( input_224 ) 
print ( output . size ())               # (1,2048, 1, 1)
output = model . logits ( output )
print ( output . size ())               # (1,1000)

`model.forward`

Méthode utilisée pour appeler model.features et model.logits . Il peut être écrasé comme vous le souhaitez.

Remarque : Une bonne pratique consiste à utiliser model.__call__ comme fonction de votre choix pour transmettre une entrée à votre modèle. Voir l'exemple ci-dessous.

 # Without model.__call__
output = model . forward ( input_224 )
print ( output . size ())      # (1,1000)

# With model.__call__
output = model ( input_224 )
print ( output . size ())      # (1,1000)

`model.last_linear`

Attribue de type nn.Linear . Ce module est le dernier à être appelé pendant la passe avant.

Peut être remplacé par un nn.Linear adapté pour un réglage fin.
Peut être remplacé par pretrained.utils.Identity pour l'extraction des caractéristiques.

Exemple lorsque le modèle est chargé à l'aide de fbresnet152 :

 print ( input_224 . size ())            # (1,3,224,224)
output = model . features ( input_224 ) 
print ( output . size ())               # (1,2048,1,1)
output = model . logits ( output )
print ( output . size ())               # (1,1000)

# fine tuning
dim_feats = model . last_linear . in_features # =2048
nb_classes = 4
model . last_linear = nn . Linear ( dim_feats , nb_classes )
output = model ( input_224 )
print ( output . size ())               # (1,4)

# features extraction
model . last_linear = pretrained . utils . Identity ()
output = model ( input_224 )
print ( output . size ())               # (1,2048)

Reproduction

Portage manuel de resnet152

 th pretrainedmodels/fbresnet/resnet152_dump.lua
python pretrainedmodels/fbresnet/resnet152_load.py

Portage automatique de Resnext

https://github.com/clcarwin/convert_torch_to_pytorch

Portage manuel de NASNET, IMCEPTIONV4 et INCECTION

https://github.com/cadene/tensorflow-model-zoo.torch

Reconnaissance

Grâce à la communauté d'apprentissage en profondeur et surtout aux contributeurs de l'écosystème Pytorch.

Développer

Informations supplémentaires

Version 1.0.0
Type Python
Date de mise à jour 2025-07-15
taille 232.55KB
Provenant de Github

Applications connexes

SiteServer v3.4.4 pour .net1.1

2024-11-14
llama models

2024-11-10
models

2024-11-03
pytorch image models

2024-11-03
PEUR Édition Or

2022-09-04
VODKA Open World Sur

2022-07-30

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ToDo Co

Python

1.0.0
Python Portfolio

Python
datamule python

Python
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout