efficient_densenet_pytorch descarga - efficient_densenet

efficient_densenet_pytorch

Pitón

1.0.0

Descargar

eficiente_densenet_pytorch

A Pytorch> = 1.0 Implementación de Densenets, optimizado para guardar la memoria de GPU.

Actualizaciones recientes

¡Ahora funciona en Pytorch 1.0! ¡Utiliza la función de control de control, lo que hace que este código sea mucho más eficiente!

Motivación

Si bien los densenets son bastante fáciles de implementar en los marcos de aprendizaje profundo, la mayoría de las implementaciones (como el original) tienden a tener hambre de memoria. En particular, el número de mapas de características intermedios generados por la normalización por lotes y las operaciones de concatenación crece cuadráticamente con la profundidad de la red. Vale la pena enfatizar que esta no es una propiedad inherente a los densenets, sino a la implementación.

Esta implementación utiliza una nueva estrategia para reducir el consumo de memoria de densenets. Utilizamos el punto de control para calcular la norma por lotes y los mapas de características de concatenación. Estos mapas de características intermedios se descartan durante el pase hacia adelante y se recomputan para el pase hacia atrás. Esto agrega 15-20% de los gastos generales de tiempo para el entrenamiento, pero reduce el consumo de mapas de características de cuadrática a lineal.

Esta implementación está inspirada en este informe técnico, que describe una estrategia para densenets eficientes a través del intercambio de memoria.

Requisitos

Pytorch> = 1.0.0
Cuda

Uso

En su proyecto existente: hay un archivo en la carpeta models .

models/densenet.py es una implementación basada en las implementaciones de TorchVision y Project Killer.

Si le importa la velocidad, y la memoria no es una opción, pase el argumento efficient=False al constructor DenseNet . De lo contrario, pase en efficient=True .

Opciones:

Todas las opciones se describen en las documentos de los archivos del modelo
La profundidad está controlada por la opción block_config
efficient=True usa la versión de eficiencia de memoria
Si desea usar el modelo para ImageNet, establezca small_inputs=False . Para CIFAR o SVHN, establezca small_inputs=True .

Ejecutando la demostración:

El único paquete adicional que necesita instalar es Python-Fire:

pip install fire

GPU único:

CUDA_VISIBLE_DEVICES=0 python demo.py --efficient True --data < path_to_folder_with_cifar 10> --save < path_to_save_dir >

GPU múltiple:

CUDA_VISIBLE_DEVICES=0,1,2 python demo.py --efficient True --data < path_to_folder_with_cifar 10> --save < path_to_save_dir >

Opciones:

--depth (int) -profundidad de la red (número de capas de convolución) (predeterminado 40)
--growth_rate (int) -número de características agregadas por capa de densenet (predeterminado 12)
--n_epochs (int) -número de épocas para el entrenamiento (predeterminado 300)
--batch_size (int) -Tamaño de minibatch (predeterminado 256)
--seed (int) -Establezca manualmente la semilla aleatoria (predeterminado Ninguno)

Actuación

Una comparación de las dos implementaciones (cada una es un Densenet-BC con 100 capas, tamaño por lotes 64, probado en un Nvidia Pascal Titan-X):

Implementación	Memoria Cosumty (GB/GPU)	Velocidad (SEC/Mini Batch)
Ingenuo	2.863	0.165
Eficiente	1.605	0.207
Eficiente (multi-GPU)	0.985	-

Otras implementaciones eficientes

Luatorch (por Gao Huang)
Tensorflow (por Joe Yearsley)
Cafe (por Tongcheng Li)

Referencia

 @article{pleiss2017memory,
  title={Memory-Efficient Implementation of DenseNets},
  author={Pleiss, Geoff and Chen, Danlu and Huang, Gao and Li, Tongcheng and van der Maaten, Laurens and Weinberger, Kilian Q},
  journal={arXiv preprint arXiv:1707.06990},
  year={2017}
}

Expandir

Información adicional

Versión 1.0.0
Tipo Pitón
Fecha de actualización 2025-07-15
tamaño 1.02MB
Proviene de Github

Aplicaciones relacionadas

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Motor de análisis de datos Lihua versión gratuita 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ToDo Co

Pitón

1.0.0
Python Portfolio

Pitón
datamule python

Pitón
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo