Descarga pretrained models.pytorch - pretrained models.pytorch Código fuente de descarga

pretrained models.pytorch

Pitón

1.0.0

Descargar

Modelos previos a la aparición para Pytorch (trabajo en progreso)

El objetivo de este repositorio es:

Para ayudar a reproducir los resultados de los trabajos de investigación (transferir configuraciones de aprendizaje, por ejemplo),
Para acceder a los convnetos previos a la aparición con una interfaz/API única inspirada en TorchVision.

Noticias:

27/10/2018: solucionar problemas de compatibilidad, agregar pruebas, agregar Travis
06/06/2018: Polynet y PNASNET-5-LARGE Gracias a Alex Parinov
16/04/2018: SE-Resnet* y SE-Resnext* Gracias a Alex Parinov
09/09/2018: Senet154 Gracias a Alex Parinov
22/03/2018: Cafferesnet101 (bueno para la localización con FasterRcnn)
21/03/2018: Nasnet Mobile gracias a Veronika Yurchuk y Anastasiia
25/01/2018: Dualpathnetworks gracias a Ross Wightman, Xception gracias a T Standley, API de transformación mejorada mejorada
13/01/2018: pip install pretrainedmodels pretrainedmodels.model_names , pretrainedmodels.pretrained_settings
12/01/2018: python setup.py install
12/08/2017: URL de datos de actualización (/! git pull es necesario)
30/11/2017: Mejorar API ( model.features(input) , model.logits(features) , model.forward(input) , model.last_linear )
16/11/2017: Modelo previo a la extensión Nasnet-A-Large portado por T. Durand y R. Cadene
22/07/2017: Modelos de vaporización previa a la visión de antorchas
22/07/2017: Momento en InceptionV4 e InceptionRetnetv2 a 0.1
17/07/2017: Model.Input_Range Attribut
17/07/2017: BnInception previamente en Imagenet

Resumen

Instalación
Ejemplos rápidos
Pocos casos de uso
- Calcular logits de ImageNet
- Calculación de métricas de validación de Imagenet
Evaluación en Imagenet
- Precisión en el valset
- Resultados reproductores
Documentación
- Modelos disponibles
  - Alexnet
  - Bninception
  - Cafferesnet101
  - Densenet121
  - Densenet161
  - Densenet169
  - Densenet201
  - Densenet201
  - Dualpathnet68
  - Dualpathnet92
  - Dualpathnet98
  - Dualpathnet107
  - Dualpathnet113
  - Fbresnet152
  - InceptionResnetv2
  - Inceptionv3
  - InceptionV4
  - Nasnet-a-large
  - Nasnet-a-mobile
  - PNASNET-5-LARGO
  - Polinet
  - Resnext101_32x4d
  - Resnext101_64x4d
  - Resnet101
  - Resnet152
  - Resnet18
  - Resnet34
  - Resnet50
  - Senet154
  - SE-Resnet50
  - SE-Resnet101
  - SE-Resnet152
  - SE-RESNEXT50_32X4D
  - SE-RESNEXT101_32X4D
  - Squeezenet1_0
  - Squeezenet1_1
  - VGG11
  - VGG13
  - VGG16
  - VGG19
  - VGG11_BN
  - VGG13_BN
  - VGG16_BN
  - VGG19_BN
  - Xcepción
- API modelo
  - modelo.input_size
  - modelo.input_space
  - Model.Input_Range
  - modelo.
  - modelo.std
  - modelo.
  - Model.GoGits
  - modelo.
Reproducción de portada
- Resnet*
- Resnext*
- Comienzo*

Instalación

Python3 con Anaconda
Pytorch con/out cuda

Instalar desde PIP

pip install pretrainedmodels

Instalar desde el repositorio

git clone https://github.com/Cadene/pretrained-models.pytorch.git
cd pretrained-models.pytorch
python setup.py install

Ejemplos rápidos

Para importar pretrainedmodels :

 import pretrainedmodels

Para imprimir los modelos previos a la pretrada disponibles:

 print ( pretrainedmodels . model_names )
> [ 'fbresnet152' , 'bninception' , 'resnext101_32x4d' , 'resnext101_64x4d' , 'inceptionv4' , 'inceptionresnetv2' , 'alexnet' , 'densenet121' , 'densenet169' , 'densenet201' , 'densenet161' , 'resnet18' , 'resnet34' , 'resnet50' , 'resnet101' , 'resnet152' , 'inceptionv3' , 'squeezenet1_0' , 'squeezenet1_1' , 'vgg11' , 'vgg11_bn' , 'vgg13' , 'vgg13_bn' , 'vgg16' , 'vgg16_bn' , 'vgg19_bn' , 'vgg19' , 'nasnetalarge' , 'nasnetamobile' , 'cafferesnet101' , 'senet154' ,  'se_resnet50' , 'se_resnet101' , 'se_resnet152' , 'se_resnext50_32x4d' , 'se_resnext101_32x4d' , 'cafferesnet101' , 'polynet' , 'pnasnet5large' ]

Para imprimir la configuración previa a la petrada disponible para un modelo elegido:

 print ( pretrainedmodels . pretrained_settings [ 'nasnetalarge' ])
> { 'imagenet' : { 'url' : 'http://data.lip6.fr/cadene/pretrainedmodels/nasnetalarge-a1897284.pth' , 'input_space' : 'RGB' , 'input_size' : [ 3 , 331 , 331 ], 'input_range' : [ 0 , 1 ], 'mean' : [ 0.5 , 0.5 , 0.5 ], 'std' : [ 0.5 , 0.5 , 0.5 ], 'num_classes' : 1000 }, 'imagenet+background' : { 'url' : 'http://data.lip6.fr/cadene/pretrainedmodels/nasnetalarge-a1897284.pth' , 'input_space' : 'RGB' , 'input_size' : [ 3 , 331 , 331 ], 'input_range' : [ 0 , 1 ], 'mean' : [ 0.5 , 0.5 , 0.5 ], 'std' : [ 0.5 , 0.5 , 0.5 ], 'num_classes' : 1001 }}

Para cargar un modelos previos a la petróleo de ImageNet:

 model_name = 'nasnetalarge' # could be fbresnet152 or inceptionresnetv2
model = pretrainedmodels . __dict__ [ model_name ]( num_classes = 1000 , pretrained = 'imagenet' )
model . eval ()

Nota : Por defecto, los modelos se descargarán a su carpeta $HOME/.torch . Puede modificar este comportamiento utilizando la variable $TORCH_HOME de la siguiente manera: export TORCH_HOME="/local/pretrainedmodels"

Para cargar una imagen y hacer un pase hacia adelante completo:

 import torch
import pretrainedmodels . utils as utils

load_img = utils . LoadImage ()

# transformations depending on the model
# rescale, center crop, normalize, and others (ex: ToBGR, ToRange255)
tf_img = utils . TransformImage ( model ) 

path_img = 'data/cat.jpg'

input_img = load_img ( path_img )
input_tensor = tf_img ( input_img )         # 3x400x225 -> 3x299x299 size may differ
input_tensor = input_tensor . unsqueeze ( 0 ) # 3x299x299 -> 1x3x299x299
input = torch . autograd . Variable ( input_tensor ,
    requires_grad = False )

output_logits = model ( input ) # 1x1000

Para extraer características (tenga en cuenta esta API no está disponible para todas las redes):

 output_features = model . features ( input ) # 1x14x14x2048 size may differ
output_logits = model . logits ( output_features ) # 1x1000

Pocos casos de uso

Calcular logits de ImageNet

Consulte ejemplos/imagenet_logits.py para calcular logits de las clases de apariencia sobre una sola imagen con un modelo previo a ImageNet.

 $ python examples/imagenet_logits.py -h
> nasnetalarge, resnet152, inceptionresnetv2, inceptionv4, ...

 $ python examples/imagenet_logits.py -a nasnetalarge --path_img data/cat.jpg
> 'nasnetalarge': data/cat.jpg' is a 'tiger cat'

Calcule las métricas de evaluación de Imagenet

Ver ejemplos/imagenet_eval.py para evaluar los modelos previos al vape en el valle de ImageNet.

 $ python examples/imagenet_eval.py /local/common-data/imagenet_2012/images -a nasnetalarge -b 20 -e
> * Acc@1 82.693, Acc@5 96.13

Evaluación en Imagenet

Precisión en el conjunto de validación (modelo único)

Los resultados se obtuvieron utilizando imágenes (centradas en el centro) del mismo tamaño que durante el proceso de entrenamiento.

Modelo	Versión	Acc@1	ACC@5
PNASNET-5-LARGO	Flujo tensor	82.858	96.182
PNASNET-5-LARGO	Nuestro porte	82.736	95.992
Nasnet-a-large	Flujo tensor	82.693	96.163
Nasnet-a-large	Nuestro porte	82.566	96.086
Senet154	Cafetería	81.32	95.53
Senet154	Nuestro porte	81.304	95.498
Polinet	Cafetería	81.29	95.75
Polinet	Nuestro porte	81.002	95.624
InceptionResnetv2	Flujo tensor	80.4	95.3
InceptionV4	Flujo tensor	80.2	95.3
SE-RESNEXT101_32X4D	Nuestro porte	80.236	95.028
SE-RESNEXT101_32X4D	Cafetería	80.19	95.04
InceptionResnetv2	Nuestro porte	80.170	95.234
InceptionV4	Nuestro porte	80.062	94.926
Dualpathnet107_5k	Nuestro porte	79.746	94.684
Resnext101_64x4d	Antorcha7	79.6	94.7
Dualpathnet131	Nuestro porte	79.432	94.574
Dualpathnet92_5k	Nuestro porte	79.400	94.620
Dualpathnet98	Nuestro porte	79.224	94.488
SE-RESNEXT50_32X4D	Nuestro porte	79.076	94.434
SE-RESNEXT50_32X4D	Cafetería	79.03	94.46
Xcepción	Keras	79.000	94.500
Resnext101_64x4d	Nuestro porte	78.956	94.252
Xcepción	Nuestro porte	78.888	94.292
Resnext101_32x4d	Antorcha7	78.8	94.4
SE-Resnet152	Cafetería	78.66	94.46
SE-Resnet152	Nuestro porte	78.658	94.374
Resnet152	Pytorch	78.428	94.110
SE-Resnet101	Nuestro porte	78.396	94.258
SE-Resnet101	Cafetería	78.25	94.28
Resnext101_32x4d	Nuestro porte	78.188	93.886
Fbresnet152	Antorcha7	77.84	93.84
SE-Resnet50	Cafetería	77.63	93.64
SE-Resnet50	Nuestro porte	77.636	93.752
Densenet161	Pytorch	77.560	93.798
Resnet101	Pytorch	77.438	93.672
Fbresnet152	Nuestro porte	77.386	93.594
Inceptionv3	Pytorch	77.294	93.454
Densenet201	Pytorch	77.152	93.548
Dualpathnet68b_5k	Nuestro porte	77.034	93.590
Cafferesnet101	Cafetería	76.400	92.900
Cafferesnet101	Nuestro porte	76.200	92.766
Densenet169	Pytorch	76.026	92.992
Resnet50	Pytorch	76.002	92.980
Dualpathnet68	Nuestro porte	75.868	92.774
Densenet121	Pytorch	74.646	92.136
VGG19_BN	Pytorch	74.266	92.066
Nasnet-a-mobile	Flujo tensor	74.0	91.6
Nasnet-a-mobile	Nuestro porte	74.080	91.740
Resnet34	Pytorch	73.554	91.456
Bninception	Nuestro porte	73.524	91.562
VGG16_BN	Pytorch	73.518	91.608
VGG19	Pytorch	72.080	90.822
VGG16	Pytorch	71.636	90.354
VGG13_BN	Pytorch	71.508	90.494
VGG11_BN	Pytorch	70.452	89.818
Resnet18	Pytorch	70.142	89.274
VGG13	Pytorch	69.662	89.264
VGG11	Pytorch	68.970	88.746
Squeezenet1_1	Pytorch	58.250	80.800
Squeezenet1_0	Pytorch	58.108	80.428
Alexnet	Pytorch	56.432	79.194

Notas:

La versión Pytorch de ResNet152 no es una portada de la antorcha7, pero ha sido reentrenada por Facebook.
Para la evaluación de Polynet, cada imagen se redimensionó a 378x378 sin preservar la relación de aspecto y luego se utilizó el parche central 331 × 331 de la imagen resultante.

Tenga cuidado, la precisión informada aquí no siempre es representativa de la capacidad transferible de la red en otras tareas y conjuntos de datos. ¡Debes probarlos todos! :PAG

Resultados reproductores

Consulte las métricas de validación de ImageNet de Compute

Documentación

Modelos disponibles

Nasnet*

Fuente: Tensorflow Slim Repo

nasnetalarge(num_classes=1000, pretrained='imagenet')
nasnetalarge(num_classes=1001, pretrained='imagenet+background')
nasnetamobile(num_classes=1000, pretrained='imagenet')

Facebook Resnet*

Fuente: Torch7 Repo of Facebook

Hay un poco diferente del resnet* de TorchVision. Resnet152 es actualmente el único disponible.

fbresnet152(num_classes=1000, pretrained='imagenet')

Caffe Resnet*

Fuente: Repo de Caffe de Kaiminghe

cafferesnet101(num_classes=1000, pretrained='imagenet')

Comienzo*

Fuente: Tensorflow Slim Repo y Pytorch/Vision Repo para inceptionv3

inceptionresnetv2(num_classes=1000, pretrained='imagenet')
inceptionresnetv2(num_classes=1001, pretrained='imagenet+background')
inceptionv4(num_classes=1000, pretrained='imagenet')
inceptionv4(num_classes=1001, pretrained='imagenet+background')
inceptionv3(num_classes=1000, pretrained='imagenet')

Bninception

Fuente: Entrenado con Caffe por Xiong Yuanjun

bninception(num_classes=1000, pretrained='imagenet')

Resnext*

Fuente: Resnext Repo of Facebook

resnext101_32x4d(num_classes=1000, pretrained='imagenet')
resnext101_62x4d(num_classes=1000, pretrained='imagenet')

Dualpathnetworks

Fuente: Repo MXNet de Chen Yunpeng

Ross Wightman ha hecho posible el porte en su repositorio de Pytorch.

Como puede ver aquí, DualPathNetWorks le permite probar diferentes escalas. El predeterminado en este repositorio es 0.875, lo que significa que el tamaño de entrada original es 256 antes de la recorte a 224.

dpn68(num_classes=1000, pretrained='imagenet')
dpn98(num_classes=1000, pretrained='imagenet')
dpn131(num_classes=1000, pretrained='imagenet')
dpn68b(num_classes=1000, pretrained='imagenet+5k')
dpn92(num_classes=1000, pretrained='imagenet+5k')
dpn107(num_classes=1000, pretrained='imagenet+5k')

'imagenet+5k' significa que la red ha sido enviada en el estado previo en ImageNet5k antes de ser fingido en ImageNet1k.

Xcepción

Fuente: Repo de Keras

T Standley ha hecho posible el porte.

xception(num_classes=1000, pretrained='imagenet')

Seneto*

Fuente: Repo de Caffe de Jie Hu

senet154(num_classes=1000, pretrained='imagenet')
se_resnet50(num_classes=1000, pretrained='imagenet')
se_resnet101(num_classes=1000, pretrained='imagenet')
se_resnet152(num_classes=1000, pretrained='imagenet')
se_resnext50_32x4d(num_classes=1000, pretrained='imagenet')
se_resnext101_32x4d(num_classes=1000, pretrained='imagenet')

PNASNET*

Fuente: Tensorflow Slim Repo

pnasnet5large(num_classes=1000, pretrained='imagenet')
pnasnet5large(num_classes=1001, pretrained='imagenet+background')

Polinet

Fuente: Repo de la cafetería del laboratorio multimedia CUHK

polynet(num_classes=1000, pretrained='imagenet')

Vía antorcha

Fuente: Repo de Pytorch/Vision

( inceptionv3 incluido en el inicio*)

resnet18(num_classes=1000, pretrained='imagenet')
resnet34(num_classes=1000, pretrained='imagenet')
resnet50(num_classes=1000, pretrained='imagenet')
resnet101(num_classes=1000, pretrained='imagenet')
resnet152(num_classes=1000, pretrained='imagenet')
densenet121(num_classes=1000, pretrained='imagenet')
densenet161(num_classes=1000, pretrained='imagenet')
densenet169(num_classes=1000, pretrained='imagenet')
densenet201(num_classes=1000, pretrained='imagenet')
squeezenet1_0(num_classes=1000, pretrained='imagenet')
squeezenet1_1(num_classes=1000, pretrained='imagenet')
alexnet(num_classes=1000, pretrained='imagenet')
vgg11(num_classes=1000, pretrained='imagenet')
vgg13(num_classes=1000, pretrained='imagenet')
vgg16(num_classes=1000, pretrained='imagenet')
vgg19(num_classes=1000, pretrained='imagenet')
vgg11_bn(num_classes=1000, pretrained='imagenet')
vgg13_bn(num_classes=1000, pretrained='imagenet')
vgg16_bn(num_classes=1000, pretrained='imagenet')
vgg19_bn(num_classes=1000, pretrained='imagenet')

API modelo

Una vez que se ha cargado un modelo previo al estado previo, puede usarlo de esa manera.

Nota importante : Toda la imagen debe cargarse utilizando PIL que escala los valores de píxeles entre 0 y 1.

`model.input_size`

Atributo de list de tipos compuesta de 3 números:

número de canales de color,
altura de la imagen de entrada,
Ancho de la imagen de entrada.

Ejemplo:

[3, 299, 299] para Inception* Reds,
[3, 224, 224] para redes resnet*.

`model.input_space`

Atribut de tipo str que representa el espacio de color de la imagen. Puede ser RGB o BGR .

`model.input_range`

Atributo de list de tipos compuesta de 2 números:

Valor de píxeles mínimo,
valor máximo de píxeles.

Ejemplo:

[0, 1] para redes resnet* e inicio*,
[0, 255] para la red Bninception.

`model.mean`

Atributo de list de tipos compuesta de 3 números que se utilizan para normalizar la imagen de entrada (suscente "en cuanto al canal de color").

Ejemplo:

[0.5, 0.5, 0.5] para las redes de inicio*,
[0.485, 0.456, 0.406] para redes resnet*.

`model.std`

Atributo de list de tipos compuesta de 3 números que se utilizan para normalizar la imagen de entrada (divide "Color-canal").

Ejemplo:

[0.5, 0.5, 0.5] para las redes de inicio*,
[0.229, 0.224, 0.225] para redes resnet*.

`model.features`

/! trabajo en progreso (puede que no esté disponible)

Método que se utiliza para extraer las características de la imagen.

Ejemplo Cuando el modelo se carga usando fbresnet152 :

 print ( input_224 . size ())            # (1,3,224,224)
output = model . features ( input_224 ) 
print ( output . size ())               # (1,2048,1,1)

# print(input_448.size())          # (1,3,448,448)
output = model . features ( input_448 )
# print(output.size())             # (1,2048,7,7)

`model.logits`

/! trabajo en progreso (puede que no esté disponible)

Método que se utiliza para clasificar las características desde la imagen.

Ejemplo Cuando el modelo se carga usando fbresnet152 :

 output = model . features ( input_224 ) 
print ( output . size ())               # (1,2048, 1, 1)
output = model . logits ( output )
print ( output . size ())               # (1,1000)

`model.forward`

Método utilizado para llamar model.features Features y model.logits . Se puede sobrescribir según lo desee.

Nota : Una buena práctica es usar model.__call__ como su función de elección para reenviar una entrada a su modelo. Vea el ejemplo a continuación.

 # Without model.__call__
output = model . forward ( input_224 )
print ( output . size ())      # (1,1000)

# With model.__call__
output = model ( input_224 )
print ( output . size ())      # (1,1000)

`model.last_linear`

Atributo del tipo nn.Linear . Este módulo es el último que se llama durante el pase hacia adelante.

Puede ser reemplazado por un nn.Linear adaptado para un ajuste fino.
Puede ser reemplazado por pretrained.utils.Identity .

Ejemplo Cuando el modelo se carga usando fbresnet152 :

 print ( input_224 . size ())            # (1,3,224,224)
output = model . features ( input_224 ) 
print ( output . size ())               # (1,2048,1,1)
output = model . logits ( output )
print ( output . size ())               # (1,1000)

# fine tuning
dim_feats = model . last_linear . in_features # =2048
nb_classes = 4
model . last_linear = nn . Linear ( dim_feats , nb_classes )
output = model ( input_224 )
print ( output . size ())               # (1,4)

# features extraction
model . last_linear = pretrained . utils . Identity ()
output = model ( input_224 )
print ( output . size ())               # (1,2048)

Reproducción

Porting de mano de resnet152

 th pretrainedmodels/fbresnet/resnet152_dump.lua
python pretrainedmodels/fbresnet/resnet152_load.py

Portación automática de resnext

https://github.com/clcarwin/convert_torch_to_pytorch

Portación manual de Nasnet, InceptionV4 e InceptionRetnnetv2

https://github.com/cadene/tensorflow-model-zoo.torch

Reconocimiento

Gracias a la comunidad de aprendizaje profundo y especialmente a los contribuyentes del ecosistema de Pytorch.

Expandir

Información adicional

Versión 1.0.0
Tipo Pitón
Fecha de actualización 2025-07-15
tamaño 232.55KB
Proviene de Github

Aplicaciones relacionadas

SiteServer v3.4.4 para .net1.1

2024-11-14
llama models

2024-11-10
models

2024-11-03
pytorch image models

2024-11-03
MIEDO Edición Oro

2022-09-04
VODKA Mundo Abierto Sur

2022-07-30

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ToDo Co

Pitón

1.0.0
Python Portfolio

Pitón
datamule python

Pitón
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo