FCOS下载 - FCOS源代码下载

FCOS

Python

1.0.0

下载

FCO：完全卷积的一阶段对象检测

该项目托管用于实施FCOS算法以进行对象检测的代码，如我们的论文所示：

 FCOS: Fully Convolutional One-Stage Object Detection;
Zhi Tian, Chunhua Shen, Hao Chen, and Tong He;
In: Proc. Int. Conf. Computer Vision (ICCV), 2019.
arXiv preprint arXiv:1904.01355

完整的论文可在以下网址提供：https：//arxiv.org/abs/1904.01355。

基于检测2的实现包含在AdeLaidet中。

这里还提供了一个具有46fps的实时型号和46fps和40.3的Coco Minival上的实时型号。

亮点

完全不含锚点： FCO完全避免了与锚盒和所有超级参数相关的复杂计算。
更好的性能：非常简单的单阶段检测器的性能要比更快的R-CNN取得更好的性能（38.7 vs. 36.8）。在此处查看更多模型和实验结果。
更快的训练和测试：使用相同的硬件和骨干固定-50-FPN，FCO还需要比更快的R-CNN更少的训练时间（6.5h vs. 8.8h）。与更快的R-CNN相比，FCO的推理时间还要少12毫米（44毫秒与56ms）。
最先进的性能：我们基于Resnext-64x4d-101的最佳模型和可变形的卷积在可可Test-DEV上的AP（带有多尺度测试）的AP中达到49.0％ 。

更新

具有快速和多样性（FAD）神经架构搜索的FCO在FAD中可以避免。（30/10/2020）
用于导出ONNX模型的脚本。（2019年11月21日）
新的NMS（请参阅＃165）将基于Resne（X）T的模型加快了30％，基于Mobilenet的模型的型号速度达到40％，其性能恰好相同。在这里查看。（2019年12月10日）
释放具有大大改进的新车型。最佳模型通过多尺度测试在可可测试DEV上获得49％的AP。（2019年11月9日）
Vovnet-FCO可在带有Vovnet骨架的FCO带有FCO。（2019年8月8日）
如下所示，使用Bbox的小区域进行训练的一种技巧将AP提高了近1点。（23/07/2019）
HRNET-FCO可在HRNET骨架上使用FCO。（2019年3月7日）
NAS-FCO可用使用AutoML搜索的FPN（R50，R101，Resnext101和MobilenetV2骨架）的FCO。（30/06/2019）
FCO已在MMDetection中实施。非常感谢 @yhcao6和@hellock。（17/05/2019）

需要硬件

我们使用8个NVIDIA V100 GPU。
但是4 1080TI GPU也可以训练基于RESNET-50-FPN的FCO，因为FCO的存储器有效。

安装

仅测试的安装

对于只想在项目中使用FCO作为对象检测器的用户，他们可以通过PIP安装。为此，运行：

 pip install torch  # install pytorch if you do not have it
pip install git+https://github.com/tianzhi0549/FCOS.git
# run this command line for a demo 
fcos https://github.com/tianzhi0549/FCOS/raw/master/demo/images/COCO_val2014_000000000885.jpg

请在此处查看接口使用。

用于完整的安装

该FCO实现基于MaskRCNN基准。因此，安装与原始MaskRCNN基准相同。

请检查install.md以获取安装说明。您可能还需要查看MaskRCNN基准的原始readme.md。

快速演示

安装完成后，您可以按照以下步骤进行快速演示。

 # assume that you are under the root directory of this project,
# and you have activated your virtual environment if needed.
wget https://huggingface.co/tianzhi/FCOS/resolve/main/FCOS_imprv_R_50_FPN_1x.pth?download=true -O FCOS_imprv_R_50_FPN_1x.pth
python demo/fcos_demo.py

推理

可可省minival拆分上的推理命令行：

 python tools/test_net.py 
    --config-file configs/fcos/fcos_imprv_R_50_FPN_1x.yaml 
    MODEL.WEIGHT FCOS_imprv_R_50_FPN_1x.pth 
    TEST.IMS_PER_BATCH 4

请注意：

如果您的模型的名称不同，请用自己的FCOS_imprv_R_50_FPN_1x.pth替换。
如果您遇到了不可存储的错误，请尝试将TEST.IMS_PER_BATCH减少到1。
如果要评估不同的模型，请更改--config-file将其配置文件（以configs/fcos）和型号为MODEL.WEIGHT 。
可以使用多GPU推理，请参阅＃78。
我们通过使用多标签NMS（请参阅＃165）提高了后过程效率，该效率平均节省了18ms。以下表中的推论指标已相应更新。

型号

为了方便起见，我们提供以下训练有素的模型（即将推出更多型号）。

Resne（X）TS：

所有基于RESNE（X）T的模型均经过微型批次和冷冻批归一化的16张图像训练（即，与MaskRCNN_BENCHMARCH中的模型一致）。

模型	多尺度培训	测试时间 / IM	AP（友人）	关联
fcos_imprv_r_50_fpn_1x	不	44ms	38.7	下载
fcos_imprv_dcnv2_r_50_fpn_1x	不	54ms	42.3	下载
fcos_imprv_r_101_fpn_2x	是的	57ms	43.0	下载
fcos_imprv_dcnv2_r_101_fpn_2x	是的	73ms	45.6	下载
fcos_imprv_x_101_32x8d_fpn_2x	是的	110ms	44.0	下载
fcos_imprv_dcnv2_x_101_32x8d_fpn_2x	是的	143ms	46.4	下载
fcos_imprv_x_101_64x4d_fpn_2x	是的	112ms	44.7	下载
fcos_imprv_dcnv2_x_101_64x4x4d_fpn_2x	是的	144ms	46.6	下载

请注意， imprv在我们的论文表3中表示improvements 。这些几乎无需成本的变化总共提高了约1.5％的绩效。因此，我们强烈建议使用它们。以下是我们初始论文中介绍的原始模型。

模型	多尺度培训	测试时间 / IM	AP（友人）	AP（test-dev）	关联
FCOS_R_50_FPN_1X	不	45ms	37.1	37.4	下载
FCOS_R_101_FPN_2X	是的	59ms	41.4	41.5	下载
fcos_x_101_32x8d_fpn_2x	是的	110ms	42.5	42.7	下载
fcos_x_101_64x4d_fpn_2x	是的	113ms	43.0	43.2	下载

Mobilenets：

我们更新基于Mobilenet模型的批处理归一化。如果要使用Syncbn，请安装Pytorch 1.1或更高版本。

模型	培训批量大小	多尺度培训	测试时间 / IM	AP（友人）	关联
fcos_syncbn_bs32_c128_mnv2_fpn_1x	32	不	26ms	30.9	下载
fcos_syncbn_bs32_mnv2_fpn_1x	32	不	33ms	33.1	下载
fcos_bn_bs16_mnv2_fpn_1x	16	不	44ms	31.0	下载

[1] 1x和2x表示该模型分别用于90K和180K迭代。
[2]所有结果都是通过单个模型获得的，没有任何测试时间数据增加，例如多尺度，翻转等。
[3] c128表示该模型在塔中有128个（而不是256个）频道（即配置中的MODEL.RESNETS.BACKBONE_OUT_CHANNELS ）。
[4] dcnv2表示可变形的卷积网络V2。请注意，对于基于重新连接的模型，我们在骨干中应用了从C3阶段到C5的可变形卷积。对于基于RESNEXT的模型，仅C4和C5阶段使用可变形的卷积。所有模型在最后一层的探测器塔中使用可变形的卷积。
[5]模型FCOS_imprv_dcnv2_X_101_64x4d_FPN_2x带有多尺度测试的模型在可可Test-DEV上的AP中获得了49.0％。请使用TEST.BBOX_AUG.ENABLED True启用多尺度测试。

训练

以下命令行将使用同步随机梯度下降（SGD）在8 GPU上训练FCOS_IMPRV_R_50_FPN_1X：

 python -m torch.distributed.launch 
    --nproc_per_node=8 
    --master_port=$((RANDOM + 10000)) 
    tools/train_net.py 
    --config-file configs/fcos/fcos_imprv_R_50_FPN_1x.yaml 
    DATALOADER.NUM_WORKERS 2 
    OUTPUT_DIR training_dir/fcos_imprv_R_50_FPN_1x

注意：

如果您想使用较少的GPU，请更改--nproc_per_node为GPU的数量。无需更改其他设置。总批量大小不取决于nproc_per_node 。如果要更改总批量大小，请在configs/fcos/fcos_r_50_fpn_1x.yaml中更改SOLVER.IMS_PER_BATCH 。
这些模型将保存到OUTPUT_DIR中。
如果您想用其他骨干训练FCO，请更改--config-file 。
如果您想在自己的数据集上训练FCO，请按照此说明＃54进行操作。
现在，使用8 GPU和4 GPU的培训可以具有相同的性能。以前的性能差距是因为我们在计算损失时没有在GPU之间同步num_pos 。

onnx

请参阅目录ONNX目录，以将模型导出到ONNX。可以在此处下载转换的模型。我们建议您使用pytorch> = 1.4.0（或每晚）和火炬> = 0.5.0（或每晚）进行ONNX型号。

为该项目做出贡献

欢迎任何拉的请求或问题。

引用

如果该项目有助于您的研究，请考虑在您的出版物中引用我们的论文。 Bibtex参考如下。

 @inproceedings{tian2019fcos,
  title   =  {{FCOS}: Fully Convolutional One-Stage Object Detection},
  author  =  {Tian, Zhi and Shen, Chunhua and Chen, Hao and He, Tong},
  booktitle =  {Proc. Int. Conf. Computer Vision (ICCV)},
  year    =  {2019}
}

 @article{tian2021fcos,
  title   =  {{FCOS}: A Simple and Strong Anchor-free Object Detector},
  author  =  {Tian, Zhi and Shen, Chunhua and Chen, Hao and He, Tong},
  booktitle =  {IEEE T. Pattern Analysis and Machine Intelligence (TPAMI)},
  year    =  {2021}
}