deep person reid Download - deep person reid Código Fonte Download

deep person reid

Pitão

v1.0.6

Baixar

Torchreid

A Torchreid é uma biblioteca para a pessoa de aprendizado profundo, escrito em Pytorch e desenvolvido para o nosso projeto ICCV'19, Omni-Scale Feature Learning for Pessoa re-identificação.

Apresenta:

Treinamento multi-GPU
suportar imagens e video-residentes
Treinamento e avaliação de ponta a ponta
Preparação incrivelmente fácil de conjuntos de dados REID
Treinamento com vários dados
Avaliação cruzada de dados de dados
Protocolo padrão usado pela maioria dos trabalhos de pesquisa
Altamente extensível (fácil de adicionar modelos, conjuntos de dados, métodos de treinamento etc.)
implementações de modelos de Reid Deep Reid de última geração
Acesso a modelos de reid pré -terenciosos
Técnicas de treinamento avançadas
Ferramentas de visualização (Tensorboard, Ranks, etc.)

Código: https://github.com/kaiyangzhou/deep-person-reid.

Documentação: https://kaiyangzhou.github.io/deep-person-reid/.

Instruções de instruções: https://kaiyangzhou.github.io/deep-person-reid/user_guide.

Modelo ZOO: https://kaiyangzhou.github.io/deep-person-reid/model_zoo.

Relatório de tecnologia: https://arxiv.org/abs/1910.10093.

Você pode encontrar alguns projetos de pesquisa construídos sobre o Torchreid aqui.

O que há de novo

[Agosto de 2022] Adicionamos recursos de exportação de modelo às seguintes estruturas: ONNX, OpenVino e Tflite. O script de exportação pode ser encontrado aqui
[Agosto de 2021] Lançamos os modelos pretados ao ImageNet de osnet_ain_x0_75 , osnet_ain_x0_5 e osnet_ain_x0_25 . A configuração pré -treinamento segue Pycls.
[Abril de 2021] Atualizamos o apêndice na versão TPAMI do OSNET para incluir resultados na configuração de generalização do domínio de várias fontes. Os modelos treinados podem ser encontrados no zoológico do modelo.
[Abril de 2021] Adicionamos um script para automatizar o processo de cálculo de resultados médios em várias divisões. Para mais detalhes, consulte tools/parse_test_res.py .
[Abril de 2021] v1.4.0 : Adicionamos o conjunto de dados de pesquisa de pessoa, CuHK-SYSU. Consulte a documentação sobre como baixar o conjunto de dados (ele contém imagens de pessoa cortada).
[Abril de 2021] Todos os modelos do zoológico do modelo foram transferidos para o Google Drive. Por favor, levante um problema se o desempenho de qualquer modelo for inconsistente com os números mostrados na página do zoológico do modelo (pode ser causado por links incorretos).
[Março de 2021] OSNET aparecerá no TPAMI Journal! Comparado com a versão da conferência, que se concentra no aprendizado de recursos discriminativos usando o bloco de construção omni em escala, essa extensão de diário considera ainda mais o aprendizado generalizável de recursos, integrando as camadas de normalização da instância à arquitetura OSNET. Esperamos que este artigo da revista possa motivar mais trabalhos futuros para taclke a questão da generalização no reid cruzado de dados.
[Mar 2021] A generalização entre os domínios (conjuntos de dados) pessoalmente a reid é crucial em aplicativos do mundo real, que está intimamente relacionada ao tópico da generalização do domínio . Interessado em aprender como o campo da generalização do domínio se desenvolveu na última década? Verifique nossa pesquisa recente neste tópico em https://arxiv.org/abs/2103.02503, com cobertura sobre a história, conjuntos de dados, problemas relacionados, metodologias, direções potenciais e assim por diante (( métodos projetados para Re-ID generalizável também são cobertos !).
[Fev 2021] v1.3.6 Adicionado University-1652, um novo conjunto de dados para a localização geográfica de várias saídas com várias vistas (crédito a Zhedong Zheng).
[Fevereiro de 2021] v1.3.5 : Agora o código do Cython funciona no Windows (crédito para lablabla).
[Jan 2021] Nosso trabalho recente, MixStyle (estatísticas de características em nível de instância de amostras de diferentes domínios para melhorar a generalização do domínio), foi aceito no ICLR'21. O código foi lançado em https://github.com/kaiyangzhou/mixstyle-release, onde a parte da pessoa é baseada no Torchreid.
[Jan 2021] Uma nova métrica de avaliação chamada de penalidade negativa inversa (MINP) para a pessoa RED foi introduzida em profundo aprendizado para a re-identificação da pessoa: uma pesquisa e perspectiva (TPAMI 2021). Seu código pode ser acessado em https://github.com/mangye16/reid-survey.
[Agosto de 2020] v1.3.3 : corrigido o bug no visrank (causado por não descompactar dsetid ).
[Agosto de 2020] v1.3.2 : Adicionado _junk_pids à grid e prid . Isso evita o uso de imagens de galeria de roteiros errôneos para treinamento ao definir combineall=True .
[Agosto de 2020] v1.3.0 : (1) Adicionado dsetid à fonte de dados de 3 tuple existente, resultando em (impath, pid, camid, dsetid) . Essa variável indica o ID do conjunto de dados e é útil ao combinar vários conjuntos de dados para treinamento (como um indicador de conjunto de dados). Por exemplo, ao combinar market1501 e cuhk03 , o primeiro receberá dsetid=0 enquanto este receberá dsetid=1 . (2) Adicionado RandomDatasetSampler . Análogo ao RandomDomainSampler , RandomDatasetSampler amostra um certo número de imagens ( batch_size // num_datasets ) de cada um dos conjuntos de dados especificados (a quantidade é determinada por num_datasets ).
[Agosto de 2020] v1.2.6 : Adicionado RandomDomainSampler (amostra de câmeras num_cams cada uma com batch_size // num_cams imagens para formar um mini-lote).
[Jun 2020] v1.2.5 : (1) A saída do Dataloader de __getitem__ foi alterada de list para dict . Anteriormente, um elemento, por exemplo, o tensor de imagem, era buscado com imgs=data[0] . Agora deve ser obtido por imgs=data['img'] . Veja esse compromisso para alterações detalhadas. (2) Adicionado k_tfm como uma opção para o carregador de dados da imagem, que permite que o aumento de dados seja aplicado k_tfm vezes independentemente a uma imagem. Se k_tfm > 1 , imgs=data['img'] retornará uma lista com tensores de imagem k_tfm .
[Maio de 2020] Adicionou o código de reconhecimento de atributos de pessoa usado no aprendizado de recursos omni em escala para re-identificação da pessoa (ICCV'19). Consulte projects/attribute_recognition/ .
[Maio de 2020] v1.2.1 : Adicionado uma API simples para extração de recursos ( torchreid/utils/feature_extractor.py ). Veja a documentação para a instrução.
[Abril de 2020] O código para reproduzir os experimentos de aprendizado mútuo profundo no artigo da OSNET (Supp. B) foi lançado em projects/DML .
[Abril de 2020] Atualizado para v1.2.0 . A classe do motor foi tornada mais agnóstica para melhorar a extensibilidade. Consulte o motor e o ImagesOftMaxEngine para obter mais detalhes. Crédito para Dassl.pytorch.
[Dez 2019] Nosso artigo da OSNET foi atualizado, com experimentos adicionais (na seção B do suplementar) mostrando algumas técnicas úteis para melhorar o desempenho da OSNET na prática.
[Novembro de 2019] ImageDataManager pode carregar dados de treinamento dos conjuntos de dados de destino definindo load_train_targets=True , e o carregador de trem pode ser acessado com train_loader_t = datamanager.train_loader_t . Esse recurso é útil para a pesquisa de adaptação de domínio.

Instalação

Verifique se o CONDA está instalado.

 # cd to your preferred directory and clone this repo
git clone https://github.com/KaiyangZhou/deep-person-reid.git

# create environment
cd deep-person-reid/
conda create --name torchreid python=3.7
conda activate torchreid

# install dependencies
# make sure `which python` and `which pip` point to the correct path
pip install -r requirements.txt

# install torch and torchvision (select the proper cuda version to suit your machine)
conda install pytorch torchvision cudatoolkit=9.0 -c pytorch

# install torchreid (don't need to re-build it if you modify the source code)
python setup.py develop

Outra maneira de instalar é executar tudo dentro do Docker Container:

Construa: make build-image
Run: make run

Comece: 30 segundos para Torchreid

Importar torchreid

 import torchreid

Carregar gerenciador de dados

 datamanager = torchreid . data . ImageDataManager (
    root = "reid-data" ,
    sources = "market1501" ,
    targets = "market1501" ,
    height = 256 ,
    width = 128 ,
    batch_size_train = 32 ,
    batch_size_test = 100 ,
    transforms = [ "random_flip" , "random_crop" ]
)

3 Modelo de construção, otimizador e lr_scheduler

 model = torchreid . models . build_model (
    name = "resnet50" ,
    num_classes = datamanager . num_train_pids ,
    loss = "softmax" ,
    pretrained = True
)

model = model . cuda ()

optimizer = torchreid . optim . build_optimizer (
    model ,
    optim = "adam" ,
    lr = 0.0003
)

scheduler = torchreid . optim . build_lr_scheduler (
    optimizer ,
    lr_scheduler = "single_step" ,
    stepsize = 20
)

Construa o motor

 engine = torchreid . engine . ImageSoftmaxEngine (
    datamanager ,
    model ,
    optimizer = optimizer ,
    scheduler = scheduler ,
    label_smooth = True
)

Executar treinamento e teste

 engine . run (
    save_dir = "log/resnet50" ,
    max_epoch = 60 ,
    eval_freq = 10 ,
    print_freq = 10 ,
    test_only = False
)

Uma interface unificada

Em "Pessoa profunda-reid/scripts/", fornecemos uma interface unificada para treinar e testar um modelo. Consulte "scripts/main.py" e "scripts/default_config.py" para obter mais detalhes. A pasta "Configs/" contém algumas configurações predefinidas que você pode usar como ponto de partida.

Abaixo, fornecemos um exemplo para treinar e testar osnet (Zhou et al. ICCV'19). Suponha que PATH_TO_DATA seja o diretório que contém conjuntos de dados REID. A variável ambiental CUDA_VISIBLE_DEVICES é omitida, que você precisa especificar se possui um pool de GPUs e deseja usar um conjunto específico deles.

Configuração convencional

Para treinar Osnet no Market1501, faça

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
--transforms random_flip random_erase 
--root $PATH_TO_DATA

O arquivo de configuração define o mercado1501 como o conjunto de dados padrão. Se você quiser usar dukemtmc-reid, faça

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
-s dukemtmcreid 
-t dukemtmcreid 
--transforms random_flip random_erase 
--root $PATH_TO_DATA 
data.save_dir log/osnet_x1_0_dukemtmcreid_softmax_cosinelr

O código será automaticamente (baixar e) carregar os pesos pré -terenciados ImageNet. Após o treinamento, o modelo será salvo como "log/osnet_x1_0_market1501_softmax_cosinelr/model.pth.tar-250". Sob a mesma pasta, você pode encontrar o arquivo Tensorboard. Para visualizar as curvas de aprendizado usando o Tensorboard, você pode executar tensorboard --logdir=log/osnet_x1_0_market1501_softmax_cosinelr no terminal e visite http://localhost:6006/ no seu navegador da web.

A avaliação é realizada automaticamente no final do treinamento. Para executar o teste novamente usando o modelo treinado, faça

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
--root $PATH_TO_DATA 
model.load_weights log/osnet_x1_0_market1501_softmax_cosinelr/model.pth.tar-250 
test.evaluate True

Configuração de domínio cruzado

Suponha que você queira treinar Osnet no Dukemtmc-Reid e testar seu desempenho no Market1501, você pode fazer

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad.yaml 
-s dukemtmcreid 
-t market1501 
--transforms random_flip color_jitter 
--root $PATH_TO_DATA

Aqui, testamos apenas o desempenho do domínio cruzado. No entanto, se você também deseja testar o desempenho no conjunto de dados de origem, ou seja, Dukemtmc -Reid, você pode definir -t dukemtmcreid market1501 , que avaliará o modelo nos dois conjuntos de dados separadamente.

Diferente da configuração do mesmo domínio, aqui substituímos random_erase por color_jitter . Isso pode melhorar o desempenho da generalização no conjunto de dados de destino invisível.

Modelos pré -treinados estão disponíveis no zoológico do modelo.

Conjuntos de dados

Conjuntos de dados de imagens

Market1501
CuHK03
Dukemtmc-Reid
MSMT17
Víbora
GRADE
CuHK01
Sensereid
Qmul-ilids
Prid

Conjuntos de dados de localização geográfica

University-1652

Conjuntos de dados de receita de vídeo

Marte
ilids-vid
Prid2011
Dukemtmc-videoreid

Modelos

Modelos de classificação do imagenet

Resnet
Resnext
Senet
Densenet
Início-ressente-V2
Início-V4
Xception
Ibn-net

Modelos leves

Nasnet
MobileNetv2
Shufflenet
Shufflenetv2
Squeezenet

Modelos específicos do REID

Mudeep
Resnet-Mid
Hacnn
PCB
Mlfn
Osnet
Osnet-Ain

Links úteis

OSNET-IBN1-LITE (código somente de teste com contêiner Lite Docker)
Aprendizagem profunda para a re-identificação da pessoa: uma pesquisa e uma perspectiva

Citação

Se você usar este código ou os modelos em sua pesquisa, dê crédito aos seguintes trabalhos:

@article{torchreid,
  title={Torchreid: A Library for Deep Learning Person Re-Identification in Pytorch},
  author={Zhou, Kaiyang and Xiang, Tao},
  journal={arXiv preprint arXiv:1910.10093},
  year={2019}
}

@inproceedings{zhou2019osnet,
  title={Omni-Scale Feature Learning for Person Re-Identification},
  author={Zhou, Kaiyang and Yang, Yongxin and Cavallaro, Andrea and Xiang, Tao},
  booktitle={ICCV},
  year={2019}
}

@article{zhou2021osnet,
  title={Learning Generalisable Omni-Scale Representations for Person Re-Identification},
  author={Zhou, Kaiyang and Yang, Yongxin and Cavallaro, Andrea and Xiang, Tao},
  journal={TPAMI},
  year={2021}
}

Expandir

Informações adicionais

Versão v1.0.6
Tipo Pitão
Data da Última Atualização 2025-07-11
tamanho 440.07KB
Vindo de Github

Aplicativos Relacionados

Versão chinesa do jogo de informações sobre pessoas suspeitas

2024-07-20
Campo Profundo

2023-07-07
Jogo Deep Hunter

2023-07-03
Di Profundo

2022-08-30
Corrida Profunda: Batalha

2022-08-29
Runa Profunda

2022-07-25

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ToDo Co

Pitão

1.0.0
Python Portfolio

Pitão
Ferramenta de gráfico de dados de código aberto Redash v24.10.0

Pitão

24.10.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos