deep person reid下载 - deep person reid源代码下载

deep person reid

Python

v1.0.6

下载

Torchreid

Torchreid是一个深入学习的人重新识别的图书馆，用Pytorch编写，并为我们的ICCV'19项目开发，“ Omni级”功能学习人员重新识别。

它的特征：

多GPU培训
支持图像和视频框架
端到端培训和评估
REID数据集的非常简单的准备
多数据集训练
跨数据库评估
大多数研究论文使用的标准协议
高度扩展（易于添加模型，数据集，培训方法等）
最先进的深里德模型的实施
访问预算的REID模型
高级培训技术
可视化工具（张板，排名等）

代码：https：//github.com/kaiyangzhou/deep-person-reid。

文档：https：//kaiyangzhou.github.io/deep-person-reid/。

操作指令：https：//kaiyangzhou.github.io/deep-person-reid/user_guide。

模型动物园：https：//kaiyangzhou.github.io/deep-person-reid/model_zoo。

技术报告：https：//arxiv.org/abs/1910.10093。

您可以在这里找到一些在Torchreid顶部建立的研究项目。

什么是新的

[2022年8月]我们已在以下框架中添加了模型导出功能：ONNX，OpenVino和Tflite。可以在此处找到导出脚本
[2021年8月]我们发布了osnet_ain_x0_75 ， osnet_ain_x0_5和osnet_ain_x0_25的Imagenet预测模型。预训练的设置遵循PYCL。
[2021年4月]我们已在OSNET的TPAMI版本中更新了附录，以在多源域概括设置中包含结果。训练有素的模型可以在模型动物园中找到。
[2021年4月]我们添加了一个脚本来自动化在多个拆分中计算平均结果的过程。有关更多详细信息，请参阅tools/parse_test_res.py 。
[2021年4月] v1.4.0 ：我们添加了搜索数据集，cuhk-sysu。请参阅有关如何下载数据集的文档（其中包含裁剪的人图像）。
[2021年4月]模型动物园中的所有模型都已移至Google Drive。如果任何模型的性能与模型动物园页面中显示的数字不一致（可能是由错误的链接引起的），请提出问题。
[2021年3月] OSNET将出现在TPAMI杂志上！与会议版本相比，该版本专注于使用Omni级构建块进行判别功能学习，该期刊扩展通过将实例归一层与OSNET体系结构集成在一起，进一步考虑了可概括的功能学习。我们希望这篇期刊论文能够激发更多的未来工作，以涉足跨数据库重新ID中的概括问题。
[2021年3月]在人身上跨域（数据集）的概括在现实世界应用中至关重要，这与域的概括是密切相关的。有兴趣了解过去十年中领域泛化领域如何发展？在https://arxiv.org/abs/2103.02503上查看我们最近在此主题中的调查，并提供有关历史，数据集，相关问题，方法，潜在方向等的覆盖范围（还涵盖了为概括性重新ID设计的方法！）。
[2021年2月] v1.3.6添加了University-1652，这是一个用于多视图多源地理位置化的新数据集（荣誉归功于Zhedong Zheng）。
[2021年2月] v1.3.5 ：现在，Cython代码在Windows上工作（贷记为Lablabla）。
[2021年1月]我们最近的工作MixStyle（混合实例级特征的特征统计数据的不同域的样本以改善域的概括）已被ICLR'21接受。该代码已在https://github.com/kaiyangzhou/mixstyle-release上发布，其中re-id零件基于torchreid。
[2021年1月]在深度学习重新识别：调查和展望（TPAMI 2021）中引入了一个新的评估指标，称为RE-ID的平均逆负罚（MINP）。可以通过https://github.com/mangye16/reid-survey访问它们的代码。
[2020年8月] v1.3.3 ：修复了visrank中的错误（由不拆箱dsetid引起）。
[2020年8月] v1.3.2 ：将_junk_pids添加到grid和prid中。这避免了使用标签的图库图像进行训练时，将其设置combineall=True 。
[2020年8月] v1.3.0 ：（1）将dsetid添加到现有的3元组数据源中，从而导致(impath, pid, camid, dsetid) 。该变量表示数据集ID，在组合多个用于培训的数据集（作为数据集指标）时很有用。例如，当组合market1501和cuhk03时，前者将分配dsetid=0而后者将分配dsetid=1 。（2）添加了RandomDatasetSampler 。类似于RandomDomainSampler ， RandomDatasetSampler从每个指定的数据集中示例了一定数量的图像（ batch_size // num_datasets ）（该量由num_datasets确定）。
[2020年8月] v1.2.6 ：添加了RandomDomainSampler （它采样了每个带有batch_size // num_cams图像num_cams摄像机以形成一个迷你批次）。
[2020年6月] v1.2.5 ：（1） __getitem__的数据加载器的输出已从list更改为dict 。以前，用imgs=data[0]获取一个元素，例如图像张量。现在应该通过imgs=data['img']获得。请参阅此提交的详细更改。（2）添加了k_tfm作为图像数据加载程序的选项，该选项允许将数据扩展k_tfm应用于图像。如果k_tfm > 1 ， imgs=data['img']返回带有k_tfm图像张量的列表。
[2020年5月]在OMNI级特征学习中使用的人属性识别代码（ICCV'19）。请参阅projects/attribute_recognition/ 。
[2020年5月] v1.2.1 ：添加了一个简单的API用于特征提取（ torchreid/utils/feature_extractor.py ）。有关指令，请参见文档。
[2020年4月]在projects/DML上发布了OSNET论文中深度相互学习的实验的代码。
[2020年4月]升级为v1.2.0 。发动机类已成为更具模型的型号，以提高可扩展性。有关更多详细信息，请参见引擎和ImagesoftMaxEngine。信用dassl.pytorch。
[2019年12月]我们的OSNET论文已进行了更新，并进行了其他实验（在补充的B节中），显示了一些有用的技术，可改善OSNET在实践中的性能。
[2019年11月] ImageDataManager可以通过设置load_train_targets=True加载目标数据集中的训练数据，并且可以使用train_loader_t = datamanager.train_loader_t访问火车加载程序。此功能可用于域适应研究。

安装

确保安装了Conda。

 # cd to your preferred directory and clone this repo
git clone https://github.com/KaiyangZhou/deep-person-reid.git

# create environment
cd deep-person-reid/
conda create --name torchreid python=3.7
conda activate torchreid

# install dependencies
# make sure `which python` and `which pip` point to the correct path
pip install -r requirements.txt

# install torch and torchvision (select the proper cuda version to suit your machine)
conda install pytorch torchvision cudatoolkit=9.0 -c pytorch

# install torchreid (don't need to re-build it if you modify the source code)
python setup.py develop

安装的另一种方法是运行Docker容器中的所有内容：

构建： make build-image
运行： make run

开始：30秒到Torchreid

导入torchreid

 import torchreid

加载数据管理器

 datamanager = torchreid . data . ImageDataManager (
    root = "reid-data" ,
    sources = "market1501" ,
    targets = "market1501" ,
    height = 256 ,
    width = 128 ,
    batch_size_train = 32 ,
    batch_size_test = 100 ,
    transforms = [ "random_flip" , "random_crop" ]
)

3构建模型，优化器和LR_SCHEDULER

 model = torchreid . models . build_model (
    name = "resnet50" ,
    num_classes = datamanager . num_train_pids ,
    loss = "softmax" ,
    pretrained = True
)

model = model . cuda ()

optimizer = torchreid . optim . build_optimizer (
    model ,
    optim = "adam" ,
    lr = 0.0003
)

scheduler = torchreid . optim . build_lr_scheduler (
    optimizer ,
    lr_scheduler = "single_step" ,
    stepsize = 20
)

构建引擎

 engine = torchreid . engine . ImageSoftmaxEngine (
    datamanager ,
    model ,
    optimizer = optimizer ,
    scheduler = scheduler ,
    label_smooth = True
)

进行训练和测试

 engine . run (
    save_dir = "log/resnet50" ,
    max_epoch = 60 ,
    eval_freq = 10 ,
    print_freq = 10 ,
    test_only = False
)

统一界面

在“ Deep-Person-Reid/Scripts/”中，我们提供了一个统一的接口来训练和测试模型。有关更多详细信息，请参见“脚本/main.py”和“脚本/default_config.py”。文件夹“ Configs/”包含一些预定义的配置，您可以将其用作起点。

在下面，我们提供了训练和测试OSNET的示例（Zhou等人ICCV'19）。假设PATH_TO_DATA是包含REID数据集的目录。省略了环境变量CUDA_VISIBLE_DEVICES ，如果您有GPU池并想要使用特定的集合，则需要指定它。

常规设置

在Market1501上训练OSNET，请

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
--transforms random_flip random_erase 
--root $PATH_TO_DATA

配置文件将Market1501设置为默认数据集。如果您想使用dukemtmc-reid，请执行

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
-s dukemtmcreid 
-t dukemtmcreid 
--transforms random_flip random_erase 
--root $PATH_TO_DATA 
data.save_dir log/osnet_x1_0_dukemtmcreid_softmax_cosinelr

该代码将自动（下载并）加载ImageNet预算的重量。训练完成后，该模型将被保存为“ log/osnet_x1_0_market1_softmax_cosinelr/model.pth.pth.tar-250”。在同一文件夹下，您可以找到张板文件。要使用张量板可视化学习曲线，您可以运行tensorboard --logdir=log/osnet_x1_0_market1501_softmax_cosinelr在终端中，并访问http://localhost:6006/在您的Web浏览器中。

评估在培训结束时自动进行。要使用受过训练的模型再次进行测试，请

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
--root $PATH_TO_DATA 
model.load_weights log/osnet_x1_0_market1501_softmax_cosinelr/model.pth.tar-250 
test.evaluate True

跨域设置

假设您想在dukemtmc-reid上训练OSNET并在Market1501上测试其性能，您可以做

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad.yaml 
-s dukemtmcreid 
-t market1501 
--transforms random_flip color_jitter 
--root $PATH_TO_DATA

在这里，我们仅测试跨域性能。但是，如果您还想测试源数据集（即Dukemtmc -reid）上的性能，则可以设置-t dukemtmcreid market1501 ，该Market1501将分别评估两个数据集中的模型。

与同一域设置不同，在这里我们用color_jitter替换random_erase 。这可以改善看不见的目标数据集上的概括性能。

验证的模型在模型动物园中可用。

数据集

图像固定数据集

Market1501
cuhk03
dukemtmc-reid
MSMT17
毒蛇
网格
cuhk01
有感觉
Qmul-ilids
prid

地理定位数据集

大学1652

视频保密数据集

火星
ilids-vid
PRID2011
DUKEMTMC-VEDEOREID

型号

成像网分类模型

重新连接
Resnext
塞特
Densenet
Inception-Resnet-V2
Inception-V4
X Ception
IBN-NET

轻量级型号

Nasnet
Mobilenetv2
Shufflenet
ShuffLenetV2
挤压

REID特定模型

Mudeep
重新连接
哈肯
PCB
MLFN
OSNET
OSNET-AIN

有用的链接

OSNET-IBN1-LITE（使用Lite Docker容器的仅测试代码）
重新识别人的深度学习：调查和前景

引用

如果您在研究中使用此代码或模型，请归功于以下论文：

@article{torchreid,
  title={Torchreid: A Library for Deep Learning Person Re-Identification in Pytorch},
  author={Zhou, Kaiyang and Xiang, Tao},
  journal={arXiv preprint arXiv:1910.10093},
  year={2019}
}

@inproceedings{zhou2019osnet,
  title={Omni-Scale Feature Learning for Person Re-Identification},
  author={Zhou, Kaiyang and Yang, Yongxin and Cavallaro, Andrea and Xiang, Tao},
  booktitle={ICCV},
  year={2019}
}

@article{zhou2021osnet,
  title={Learning Generalisable Omni-Scale Representations for Person Re-Identification},
  author={Zhou, Kaiyang and Yang, Yongxin and Cavallaro, Andrea and Xiang, Tao},
  journal={TPAMI},
  year={2021}
}

展开

附加信息