download efficient_densenet_pytorch - efficient_densenet

efficient_densenet_pytorch

Pitão

1.0.0

Baixar

eficiente_densenet_pytorch

A Pytorch> = 1.0 Implementação de Densenets, otimizada para salvar a memória da GPU.

Atualizações recentes

Agora funciona no Pytorch 1.0! Ele usa o recurso Ponto de verificação, o que torna esse código muito mais eficiente !!!

Motivação

Embora os Densenets sejam bastante fáceis de implementar em estruturas de aprendizado profundo, a maioria das implicações (como o original) tende a ter faminta por memória. Em particular, o número de mapas de recursos intermediários gerados pelas operações de normalização e concatenação em lote cresce quadraticamente com a profundidade da rede. Vale ressaltar que isso não é uma propriedade inerente aos densenets, mas à implementação.

Esta implementação usa uma nova estratégia para reduzir o consumo de memória de Densenets. Utilizamos o check -se para calcular os mapas de recursos de norma e concatenação em lote. Esses mapas de recursos intermediários são descartados durante o passe para a frente e recomputados para o passe para trás. Isso adiciona 15-20% da sobrecarga de tempo para treinamento, mas reduz o consumo de mapas de recursos de quadrático a linear.

Essa implementação é inspirada neste relatório técnico, que descreve uma estratégia para densenets eficientes via compartilhamento de memória.

Requisitos

Pytorch> = 1.0.0
CUDA

Uso

No seu projeto existente: existe um arquivo na pasta models .

models/densenet.py é uma implementação baseada nas implementações da Torchvision e do Project Killer.

Se você se preocupa com a velocidade e a memória não é uma opção, passe o efficient=False no construtor DenseNet . Caso contrário, passe em efficient=True .

Opções:

Todas as opções são descritas nos documentos dos arquivos do modelo
A profundidade é controlada pela opção block_config
efficient=True usa a versão com eficiência de memória
Se você deseja usar o modelo para imagenet, set small_inputs=False . Para cifar ou svhn, set small_inputs=True .

Executando a demonstração:

O único pacote extra que você precisa instalar é o python-fogo:

pip install fire

GPU único:

CUDA_VISIBLE_DEVICES=0 python demo.py --efficient True --data < path_to_folder_with_cifar 10> --save < path_to_save_dir >

GPU múltiplo:

CUDA_VISIBLE_DEVICES=0,1,2 python demo.py --efficient True --data < path_to_folder_with_cifar 10> --save < path_to_save_dir >

Opções:

--depth (int) -profundidade da rede (número de camadas de convolução) (padrão 40)
--growth_rate (int) -Número de recursos adicionados por camada densenet (padrão 12)
--n_epochs (int) -Número de épocas para treinamento (padrão 300)
--batch_size (int) -tamanho do minibatch (padrão 256)
--seed (int) -defina manualmente a semente aleatória (padrão nenhum)

Desempenho

Uma comparação das duas implementações (cada uma é um Densenet-BC com 100 camadas, tamanho 64 do lote, testado em um Nvidia Pascal Titan-X):

Implementação	Cosunção de memória (GB/GPU)	Velocidade (seg/mini lote)
Ingênuo	2.863	0,165
Eficiente	1.605	0,207
Eficiente (multi-GPU)	0,985	-

Outras implementações eficientes

Luatorch (de Gao Huang)
Tensorflow (de Joe Yearsley)
Caffe (de Tongcheng Li)

Referência

 @article{pleiss2017memory,
  title={Memory-Efficient Implementation of DenseNets},
  author={Pleiss, Geoff and Chen, Danlu and Huang, Gao and Li, Tongcheng and van der Maaten, Laurens and Weinberger, Kilian Q},
  journal={arXiv preprint arXiv:1707.06990},
  year={2017}
}

Expandir

Informações adicionais

Versão 1.0.0
Tipo Pitão
Data da Última Atualização 2025-07-15
tamanho 1.02MB
Vindo de Github

Aplicativos Relacionados

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Mecanismo de análise de dados Lihua versão gratuita 3.0_search_navigation_collection_public parecer_ranking_api

2022-06-28

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ToDo Co

Pitão

1.0.0
Python Portfolio

Pitão
datamule python

Pitão
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos